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内 容 提 要 

本 书 是 一 部 UNIX 网 络 编程 的 经 典 之 作 ! 进程 间 通 信 (IPC) 几乎 
是 所 有 UNIX 程 序 性 能 的 关键 ， 理 解 IPC 也 是 理解 如 何 开发 不 同 主机 间 
网 络 应 用 程序 的 必要 条 件 。 本 书 从 对 Posix IPC 和 System V IPC 的 内 部 
结构 开始 讨论 ， 全 面 深入 地 介绍 了 4 种 IPC 形 式 : 消息 传递 (管道 、 
FIFO、 消 息 队 列 ) 、 同 步 〈 互 斥 锁 、 条 件 变 量 、 读 写 锁 、 文 件 与 记录 
锁 、 信 和 号 量 ) 、 共 享 内 存 (匿名 共享 内 存 、 具 名 共享 内 存 ) 及 远程 过 
程 调用 (Solaris 门 、Sun RPC) 。 附 录 中 给 出 了 测量 各 种 IPC 形 式 性 能 
的 方法 。 

本 书 内 容 详尽 且 具 权威 性 ， 几 乎 每 章 都 提供 精 选 的 习题 ， 并 提供 
了 部 分 习题 的 答案 ， 是 网 络 研究 和 开发 人 员 理想 的 参考 书 。 
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概述 

大 多 数 重 要 的 程序 都 涉及 进程 间 通 信 ( Interprocess 
Communication,IPC) 。 这 是 受 下 述 设 计 原 则 影响 的 自然 结果 : 把 应 用 
程序 设计 为 一 组 相互 通信 的 小 片断 比 将 其 设计 为 单个 庞大 的 程序 更 
好 。 从 历史 角度 看 ， 应 用 程序 有 如 下 几 种 构建 方法 。 

(1 用 一 个 庞大 的 程序 完成 全 部 工作 。 程 序 的 各 部 分 可 以 实现 为 函 
数 ， 函 数 之 间 通 过 参数 、 返 回 值 和 全 局 变量 来 交换 信息 。 

(2) 使 用 多 个 程序 ， 程 序 之 间 用 某 种 形式 的 IPC 进 行 通信 。 许 多 标 
准 的 UNIX 工 具 都 是 按 这 种 风格 设计 的 ， 它 们 使 用 shell 管 道 (IPC 的 一 
种 形式 ) 在 程序 之 间 传 递 信息 。 

(3) 使 用 一 个 包含 多 个 线程 的 程序 ， 线 程 之 间 使 用 某 种 IPC。 这 里 
仍然 使 用 术语 IPC， 尽 管 通信 是 在 线程 之 间 而 不 是 在 进程 之 间 进 行 
的 。 

还 可 以 把 后 两 种 设计 形式 结合 起 来 : 用 多 个 进程 来 实现 ， 其 中 每 
个 进程 包含 几 个 线程 。 在 这 种 情况 下 ， 进 程 内 部 的 线程 之 间 可 以 通 
信 ， 不 同 的 进程 之 间 也 可 以 通信 。 

上 面 讲述 了 可 以 把 完成 给 定 任务 所 需 的 工作 分 到 多 个 进程 中 ， 或 
许 还 可 以 进一步 分 到 进程 内 的 多 个 线程 中 。 在 包含 多 个 处 理 需 

(CPU) 的 系统 中 ， 多 个 进程 也 许可 以 (在 不 同 的 CPU 上 ) 同时 运 
行 ， 或 许 给 定 进程 内 的 多 个 线程 也 能 同时 运行 。 因 此 ， 把 任务 分 到 多 
个 进程 或 线程 中 有 望 减少 完成 指定 任务 的 时 间 。 


本 书 详细 描述 了 以 下 4 种 不 同 的 IPC 形 式 : 
(1) 消 息 传 递 (管道 、FIFO 和 消息 队列 ) ; 
(2) 同 步 〈 互 斥 量 、 条 件 变量 、 读 写 锁 、 文 件 和 记录 锁 、 信 号 


) 


wl 


(3) 共 享 内 存 (匿名 的 和 具名 的 ) ; 

(4) 远 程 过 程 调用 (Solaris! ] 和 Sun RPC) 

本 书 不 讨论 如 何 编写 通过 计算 机 网 络 通信 的 程序 。 这 种 通信 通常 
涉及 使 用 TCP/IP 协 议 族 的 套 接 字 API， 相 关 主 题 在 第 1 卷 [Stevens 1998] 
中 有 详细 讨论 。 

有 人 可 能 会 提出 质疑 : 不 应 该 使 用 单 主 机 或 非 网 络 IPC (本 卷 的 
主题 ) ， 所 有 程序 都 应 该 网 络 上 的 多 台 主 机 上 同时 运行 。 但 在 日 常 实 
践 中 ， 单 主机 IPC 往 往 比 网 络 通信 快 得 多 ， 而 且 有 还 简单 些 。 共 享 内 
存 、 同 步 等 方法 通常 也 只 能 用 于 单 主机 ， 跨 网 络 时 可 能 无 法 使 用 。 经 
验 和 史 表 明 ， 非 网 络 IPC (A) 与 跨 网 络 IPC (81%) 都 是 需要 
的 。 

本 卷 建 立 在 第 1 卷 和 我 写 的 另外 4 本 书 的 基础 上 ， 这 5 本 书 在 本 书 中 
简 记 如 下 : 

UNPv1: UNIX Network Programming, Volume 1 [Stevens 1998]; 

APUE: Advanced Programming in the UNIX Environment [Stevens 
1992]; 

TCPv1: TCP/IP Illustrated, Volume 1 [Stevens 1994]; 

TCPv2: TCP/IP Illustrated, Volume 2 [Wright and Stevens 1995]; 

TCPv3: TCP/IP Illustrated, Volume 3 [Stevens 1996] ° 

在 一 本 书 名 包含 “网 络 编程 ”的 书 中 讨论 IPC 看 似 有 点 奇怪 ， 但 事实 
上 IPC 经 常用 于 网 络 应 用 程序 。 我 在 《UNIX 网 络 编程 》1990 年 版 的 前 
言 里 就 指出 :“ 想 知道 如 何 为 网 络 开 发 软件 ， 必 须 先 理解 进程 间 通 信 

(IPC) 


与 第 1 版 的 区 别 

本 书 完 全 重 写 并 扩充 了 1990 年 版 《UNIX 网 络 编程 》 的 第 3 章 和 第 
18 章 。 字 数 统 计 表 明 ， 现 在 的 内 容 是 第 1 版 的 5 倍 。 新 版 的 主要 改动 归 
纳 如 下 。 

不 仅 讨 论 了 “System V IPC” 的 三 种 形式 (消息 队列 、 信 号 量 以 及 
共享 内 存 ) ， 还 对 实现 了 这 些 IPC 的 新 的 Posix 函 数 进行 了 介绍 。 (1.7 
节 将 详细 介绍 Posix 标 准 族 。) 我 认为 使 用 Posix IPCI BE AS PTE, 
因为 它们 比 System V 中 的 相应 部 分 更 具 优 势 。 

讨论 了 用 于 同步 的 Posix 函 数 : 互 斥 锁 、 条 件 变量 以 及 读 写 锁 。 它 
们 可 用 于 线程 或 进程 的 同步 ， 而 且 往往 在 访问 共享 内 存 时 使 用 。 

本 卷 假 定 使 用 Posix 线 程 环境 ( 称 为 “Pthreads”) ， 许 多 示例 都 是 
用 多 线程 而 不 是 多 进程 构建 的 。 

对 管道 、FIFO 和 记录 锁 的 讨论 侧重 于 从 它们 的 Posix 定 义 出 发 。 

本 卷 不 仅 描述 了 IPC 机 制 及 其 使 用 方法 ， 还 实现 了 Posix 消 息 队 
列 、 读 写 锁 与 Posix 信 和 号 量 (都 可 以 实现 为 用 户 库 ) 。 这 些 实现 可 以 把 
多 种 不 同 的 特性 捆绑 起 来 〈 例 如 ，Posix 信 和 号 量 的 一 种 实现 用 到 了 互 斥 
量 、 条 件 变量 和 内 存 映射 T7O) ， 还 强调 了 我 们 在 应 用 程序 中 经 常 要 处 
理 的 一 些 问题 (如 竞争 状态 、 错 误 处 理 、 内 存 泄漏 和 变 长 参数 列 
K) 。 理 解 某 种 特性 的 实现 通常 有 助 于 了 解 如 何 使 用 该 特性 。 

对 RPC 的 讨论 侧重 于 Sun 的 RPC 包 。 在 此 之 前 讲述 了 新 的 Solaris 门 
API， 它 类 似 于 RPC 但 用 于 单 主机 。 这 人 么 一 来 我 们 残 介 绍 了 许多 在 调用 
其 他 进程 中 的 过 程 时 需要 考虑 的 特性 ， 而 不 用 关心 网 络 方面 的 细 。 

读者 对 象 

本 书 既 可 以 用 作 IPC 的 教程 ， 也 可 以 用 作 有 经 验 的 程序 员 的 参考 
书 。 全 书 划 分 为 以 下 4 个 主要 部 分 : 

消息 传递 ; 

同步 ; 


共享 内 存 ; 

远程 过 程 调 用 。 

但 许多 读者 可 能 只 对 特定 的 部 分 感 兴趣 。 第 2 章 总 结 了 所 有 了 Posix 
IPC 函 数 共 有 的 特性 ， 第 3 革 归 纳 了 所 有 System V IPCHA A AY FF 
性 ， 第 12 章 介绍 了 Posix 和 System V 的 共享 内 存 ， 但 书 中 多 数 章 市 都 可 
以 独立 于 其 他 革 市 阅读 。 所 有 读者 都 应 该 阅读 第 1 草 ， 尤 其 是 1.6 荫 ， 
该 节 介 绍 了 一 些 贯 罕 全 书 的 包装 函数 。 讨 论 Posix IPC 的 各 章 与 讨论 
System V IPC 的 各 草 彼 此 独立 ， 有 关 管 道 、FIFO 和 记录 锁 的 几 章 不 属 
于 上 述 两 个 阵营 ， 关 于 RPC 的 两 革 也 独立 于 其 他 IPC 方 法 。 

为 了 方便 读者 把 本 书 作为 参考 书 ， 本 书 提供 了 完整 的 全 文 索 引 ， 
并 在 最 后 儿 页 总 结 了 每 个 函数 和 结构 的 详细 描述 在 正文 中 的 哪里 可 以 
找到 。 为 了 给 不 按 顺 序 了 阅读 本 书 的 读者 提供 方便 ， 我 们 在 书 中 为 各 个 
主题 提供 了 大 量 的 交叉 引用 。 

源 代码 与 勘误 

书 中 所 有 示例 的 源 代码 可 以 从 作者 主页 ( 列 在 前 言 的 最 后 ) 获得 
[1]。 学 习 本 书 讲述 的 IPC 技 术 的 最 好 方法 就 是 下 载 这 些 程序 ， 对 其 进 
行 修改 和 改进 。 只 有 这 样 实际 编 写 代 码 才 能 深入 理解 有 天 概 念 和 方 
法 。 每 草 末尾 都 提供 了 大 量 的 习题 ， 大 部 分 已 在 附录 DD 中 给 出 答 采 。 

本 书 的 最 新 勘误 表 也 可 以 从 作者 主页 获取 。 
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第 1 章 简介 
1.1 概述 


IPC 是 进程 间 通 信 (interprocess communication) 的 简称 。 传 统 上 该 
术语 摘 述 的 是 运行 在 某 个 操作 系统 之 上 的 不 同 进程 间 各 种 消息 传递 
( message passing ) 的 方式 。 本 书 还 讲述 多 种 形式 的 同步 
(Synchronization ) ， 因 为 像 共 享 内 存 区 这 样 的 较 新 式 的 通信 需要 某 种 
形式 的 同步 参与 运作 。 
在 Unix 操 作 系 统 过 去 30 年 的 演变 史 中 ， 消 居 传 递 历经 了 如 下 几 个 
发 展 阶段 。 
管道 (pipe， 第 4 章 ) 是 第 一 个 广泛 使 用 的 IPC 形 式 ， 既 可 在 程序 中 
使 用 ， 也 可 从 shell 中 使 用 。 管 道 的 问题 在 于 它们 只 能 在 具有 共同 祖先 
( 指 父子 进程 关系 ) 的 进程 间 使 用 ， 不 过 该 问题 已 随 有 名 管道 (named 
pipe) 即 FIFO (第 4 章 ) 的 引入 而 解决 了 。 
System VIA EA | (System V message queue， 第 6 章 ) 是 在 20 世 纪 
80 年 代 早 期 加 到 System V 内 核 中 的 。 它 们 可 用 在 同一 主机 上 有 亲 毕 天 
系 或 无 亲 绿 天 系 的 进程 之 间 。 尽 管 称呼 它 们 时 仍 冠 以 “System VRI, 
当今 多 数 版 本 的 Unix 却 不 论 目 己 是 否 源 目 System V 都 文 持 它们 。 


在 谈论 Unix 进 程 时 ， 有 亲缘 关系 (related) 的 说 法 意味 着 所 论 及 的 
进程 具有 某 个 共同 的 祖先 。 说 得 更 明白 点 ， 这 些 有 亲缘 天 系 的 进程 是 
从 该 得 先进 程 经 过 一 次 或 多 次 fork 派 生来 的 。 一 个 常见 的 例子 是 在 某 个 
进程 调用 fork 两 次 ,派生 出 两 个 子 进 程 。 我 们 说 这 两 个 子 进程 是 有 亲缘 
关系 的 。 同 样 ， 每 个 子 进 程 与 其 父 进程 也 是 有 亲缘 关系 的 。 考 虑 到 
IPC， 父 进程 可 以 在 调用 fork 前 建立 某 种 形式 的 IPC (Plan Se BIE BA 
列 ) ， 因 为 它 知 道 随后 派生 的 两 个 子 进程 将 穿越 fork 继 承 该 IPC 对 象 。 
我 们 随 图 1-6 详 细 讨 论 各 种 IPC 对 象 的 继承 性 。 我 们 还 得 注意 ， 从 理论 
上 说 ， 所 有 Unix 进 程 与 init 进 程 都 有 杀 绿 关系 ， 它 是 在 系统 目 举 时 启动 
所 有 初始 化 进程 的 祖先 进程 。 然 而 从 实践 上 说 ， 进 程 亲 绿 天 系 开 始 于 
一 个 登录 shell ( 称 为 一 个 会 话 ) 以 及 由 该 shell 派 生 的 所 有 进程 。APUE 
的 第 9 章 详细 讨论 会 话 和 进程 亲缘 关系 。 

本 书 将 全 文 使 用 缩 进 的 插入 式 注解 (如 此 处 所 示 ) 来 说 明 实现 上 
的 细节 、 历 史上 的 观点 以 及 其 他 琐事 。 

Posix 消 息 队 列 (Posix 消 息 队 列 ， 第 5 章 ) 是 由 Posix 实 时 标准 

(1003.1b-1993， 将 在 1.7 节 详细 讨论 ;加 入 的 。 它 们 可 用 在 同一 主机 上 
有 亲缘 关系 和 无 亲缘 关系 的 进程 之 间 。 

远程 过 程 调 用 (Remote Procedure Call，RPC， 第 五 部 分 ) 出 现在 
20 世 纪 80 年 代 中 期 ， 它 是 从 一 个 系统 (客户 主机 ) 上 某 个 程序 调用 另 
一 个 系统 (服务 器 主机 ) 上 某 个 函数 的 一 种 方法 ， 是 作为 显 式 网 络 编 
程 的 一 种 蔡 换 方法 开发 的 。 既 然 客 户 和 服务 絮 之 间 通 常 传递 一 些 信息 

(被 调用 函数 的 参数 与 返回 值 ) ， 而 且 RPC 可 用 在 同一 主机 上 的 客户 
和 服务 器 之 间 ， 因 此 可 认为 RPC 是 另 一 种 形式 的 消息 传递 。 

看 一 看 由 Unix 提 供 的 各 种 同步 形式 的 演变 同样 颇 有 教 益 。 

需要 某 种 同步 形式 (往往 是 为 了 防止 多 个 进程 同时 修改 同一 文 
件 ) 的 早期 程序 使 用 了 文件 系统 的 诡秘 特性 ， 我 们 将 在 9.8 节 讨论 其 中 


的 一 些 。 


记录 上 锁 (record locking， 第 9 章 ) 是 在 20 世 纪 80 年 代 早期 加 到 
Unix 内 核 中 的 ， 然 后 在 1988 年 由 Posix.1 标 准 化 的 。 

System V 信 号 量 (System V semaphore， 第 11 章 ) 是 在 System VIA 
息 队 列 加 入 System V 内 核 的 同时 (20 世 纪 80 年 代 早 期 ) 伴随 System VIE 
享 内 存 区 (System V shared memory) 加 入 的 。 当 今 多 数 版 本 的 Unix 都 
支持 它们 。 

Posix 信 号 量 (Posix semaphore ， 第 10 章 ) 和 Posix 共 享 内 存 区 

(Posix shared memory， 第 13 章 ) 也 由 Posix 实 时 标准 (1003.1b-1993) 
加 入 。 

H FER (mutex) 和 条 件 变量 (condition variable， 第 7 章 ) 是 由 
Posix 线 程 标准 (1003.1c-1995) 定义 的 两 种 同步 形式 。 尽 管 往往 用 于 线 
程 间 的 同步 ， 它 们 也 能 提供 不 同 进程 间 的 同步 。 

读 写 锁 (read-write lock， 第 8 章 ) 是 另 一 种 形式 的 同步 。 它 们 还 没 
有 被 Posix 标 准 化 ， 不 过 也 许 不 久 后 会 被 标准 化 。 


1.2 进程 、 线 程 与 信息 共享 


按照 传统 的 Unix 编 程 模型 ， 我 们 在 一 个 系统 上 运行 多 个 进程 ， 每 
个 进程 都 有 各 自 的 地 址 空间 。Unix 进 程 间 的 信息 共享 可 以 有 多 种 方 
式 。 图 1-1 对 此 作 了 总 结 。 


图 1-1 Unix 进 程 间 共享 信息 的 三 种 方式 

(1) 左 边 的 两 个 进程 共享 存留 于 文件 系统 中 某 个 文件 上 的 某 些 信 
上 息 。 为 访问 这 些 信 息 ， 每 个 进程 都 得 穿越 内 核 (例如 read ^ write ^ Iseek 
SE) 。 当 一 个 文件 有 待 更 新 时 ， 某 种 形式 的 同步 是 必要 的 ， 这 样 既 可 
保护 多 个 写 入 者 ， 防 止 相互 串扰 ， 也 可 保护 一 个 或 多 个 读 出 者 ， 防 止 
写 入 者 的 干扰 。 

(2) 中 间 的 两 个 进程 共享 驻 留 于 内 核 中 的 某 些 信息 。 管 道 是 这 种 共 
享 类 型 的 一 个 例子 ， System V 消 息 队 列 和 System V 信 号 量 
访问 共享 信息 的 每 次 操作 涉及 对 内 核 的 一 次 系统 调用 。 

(3) 右 边 的 两 个 进程 有 一 个 双方 都 能 访问 的 共享 内 存 区 。 每 个 进程 
一 旦 设置 好 该 共享 内 存 区 ， 束 能 根本 不 涉及 内 核 而 访问 其 中 的 数据 。 
共享 该 内 存 区 的 进程 需要 某 种 形式 的 同步 。 

注意 没有 任何 东西 限制 任何 IPC 技 术 只 能 使 用 两 个 进程 。 我 们 讲述 
的 技术 适用 于 任意 数目 的 进程 。 在 图 1-1 中 只 展示 两 个 进程 是 为 了 简单 
起 见 。 

线程 

虽然 Unix 系 统 中 进程 的 概念 已 使 用 了 很 入 ， 一 个 给 定 进 程 内 多 个 
线程 (thread) 的 概念 却 相对 较 新 。Posix.1 线 程 标准 〈 称 为 "Pthreads”) 
是 于 1995 年 通过 的 。 从 IPC 和 角度 看 来 ， 一 个 给 定 进程 内 的 所 有 线程 共享 
同样 的 全 局 变量 (也 束 是 说 共享 内 存 区 的 概念 对 这 种 模型 来 说 是 内 在 
HJ) 。 然 而 我 们 必须 关注 的 是 各 个 线程 间 对 全 局 数据 的 同步 访问 。 同 
步 尽 管 不 是 一 种 明确 的 了 PC 形式 ， 但 它 确 实 伴随 许多 形式 的 IPC 使 用 ， 
以 控制 对 某 些 共享 数据 的 访问 。 

本 书 中 我 们 讲述 进程 间 的 IPC 和 线程 则 的 IPC。 我 们 假设 有 一 个 线 
程 环境 ， 并 作 类 似 如 下 形式 的 陈述 : “如 果 管 道 为 室 ， 调 用 线程 就 阻塞 
在 它 的 read 调 用 上 ， 直 到 菜 个 线程 往 该 管道 写 入 数据 。” 要 是 你 的 系统 
不 支持 线程 ， 那 你 可 以 将 该 句子 中 的 “线程 * 蔡 换 成 “进程 >"， 从 而 提供 
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“阻塞 在 对 罕 管 道 的 read 调 用 上 ?的 经 典 Unix 定 义 。 然 而 在 文 持 线程 的 系 
统 上 ， 只 有 对 至 管道 调用 read 的 那个 线程 阻塞 ， 同 一 进程 中 的 其 余 线程 
才 可 以 继续 执行 。 同 该 空 管道 写 数据 的 工作 既 可 以 由 同一 进程 中 的 另 
一 个 线程 去 做 ， 也 可 以 由 为 一 个 进程 中 的 某 个 线程 去 做 。 

附 邓 B 让 总 了 线程 的 某 些 特征 以 及 全 书 都 用 到 的 5 个 基本 的 Pthread 


1.3 IPC 对 象 的 持续 性 


我 们 可 以 把 任意 类 型 的 IPC 的 持续 性 (persistence) 定义 成 该 类 型 
的 一 个 对 象 一 直 存 在 多 长 时 间 。 图 1-2 展 示 了 三 种 类 型 的 持续 性 。 


随 进程 持续 的 IPC: 一 直 存 在 到 打开 着 IPC 
对 象 的 最 后 一 个 进程 关闭 该 对 象 为 止 


随 内 核 持续 的 IPC: 一 直 存 在 到 内 核 重新 
目 举 或 显 式 删 除 IPC 对 象 为 止 


随 文件 系统 持续 的 IPC: 一 直 存 在 到 显 式 
删除 IPC 对 象 为 止 


图 1-2 IPC 对 象 的 持续 性 


(1) 随 进程 持续 的 (process-persistent) IPC 对 象 一 直 存 在 到 打开 着 
该 对 象 的 最 后 一 个 进程 关闭 该 对 象 为 止 。 例 如 管道 和 FIFO 束 是 这 种 对 


象 。 

(2) 随 内 核 持 续 的 (kernel-persistent) IPC 对 象 一 直 存 在 到 内 核 重 新 
自 举 或 显 式 删除 该 对 象 为 止 。 例 如 System V 的 消息 队列 、 信 和 号 量 和 共 
享 内 存 区 就 是 此 类 对 象 。Posix 的 消息 队列 、 信 号 量 和 共享 内 存 区 必须 
至 少 是 随 内 核 持 续 的 ， 但 也 可 以 是 随 文件 系统 持续 的 ， 具 体 取 决 于 实 
现 。 

(3) 随 文件 系统 持续 的 (filesystem-persistent) IPC 对 象 一 直 存 在 到 
显 式 删 除 该 对 象 为 止 。 即 使 内 核 重 新 自 举 了 ， 该 对 象 还 是 保持 其 值 。 
Posix 消 息 队 列 、 信 号 量 和 共享 内 存 区 如 有 果 是 使 用 映射 文件 实现 的 (不 
是 必需 条 件 ) ， 那 么 它们 就 是 随 文件 系统 持续 的 。 

在 定义 一 个 IPC 对 象 的 持续 性 时 我 们 必须 小 心 ， 因 为 它 并 不 总 是 像 
看 起 来 的 那样 。 例 如 管道 内 的 数据 是 在 内 核 中 维护 的 ， 但 管道 具备 的 
是 随 进程 的 持续 性 而 不 是 随 内 核 的 持续 性 : 最 后 一 个 将 某 个 管道 打开 
着 用 于 读 的 进程 关闭 该 管道 后 ， 内 核 将 丢弃 所 有 的 数据 并 删除 该 管 
道 。 类 似 地 ， 尽 管 FIFO 在 文件 系统 中 有 名 字 ， 它 们 也 只 是 具备 随 进程 
的 持续 性 ， 因 为 最 后 一 个 将 某 个 FIFO 打 开 着 的 进程 关闭 该 FIFO 后 ， 
FIFO 中 的 数据 都 被 丢弃 。 

图 1-3 汇 总 了 将 在 本 书 中 讲述 的 各 种 类 型 IPC 对 象 的 持续 性 。 


FIFO 随 进程 

Posix H. Fr fil 随 进程 

Posix 条 件 变量 随 进程 

Posix 读 写 锁 随 进程 

fcnt1 记 录 上 锁 随 进 程 

Posix 消 息 队 列 随 内 核 

Posix 有 名 信号 量 随 内 核 

Posix 基 于 内 存 的 信号 量 随 进 程 

Posix 共 号 随 内 核 

System Vili Ei BA Fi] 随 内 核 

System V 信 和 号 量 随 内 核 

System V 共 享 内 存 区 随 内 核 

TCP 套 接 字 随 进程 

UDP 套 接 宇 随 进程 

Unix 域 套 接 字 随 进程 
图 1-3 各 种 类 型 IPC 对 象 的 持续 性 

注意 该 列表 中 没有 任何 类 型 的 IPC 具 备 随 文件 系统 的 持续 性 ， 但 是 
我 们 说 过 有 三 种 类 型 的 Posix IPC 可 能 会 具备 该 持续 性 ， 这 取决 于 它们 
的 实现 。 显 然 ， 辣 一 个 文件 写 入 数据 提供 了 随 文 件 系 统 的 持续 性 ， 但 
这 通常 不 作为 一 种 IPC 形 式 使 用 。 多 数 形式 的 IPC 并 没有 在 系统 重新 目 
举 后 继续 存在 的 打算 ， 因 为 进程 不 可 能 跨越 重新 目 举 继续 存活 。 对 于 
一 种 给 定形 式 的 IPC， 要 求 它 具备 随 文件 系统 的 持续 性 可 能 会 使 其 性 能 
降级 ， 而 IPC 的 一 个 基本 的 设计 目标 是 高 性 能 。 


1.4 空间 


当 两 个 或 多 个 无 亲缘 关系 的 进程 使 用 某 种 类 型 的 IPC 对 象 来 彼此 交 
换 信 息 时 ， 该 PC 对 象 必须 有 一 个 某 种 形式 的 名 字 (name) 或 标识 符 
(identifier) ， 这 样 其 中 一 个 进程 (往往 是 服务 器 ) 可 以 创建 该 IPC 对 
象 ， 其 余 进程 则 可 以 指定 同一 个 IPC 对 象 。 
管道 没有 名 字 〈 因 此 不 能 用 于 无 亲缘 关系 的 进程 间 ) ， 但 是 FIFO 
有 一 个 在 文件 系统 中 的 Unix 路 径 名 作为 其 标识 符 《因此 可 用 于 无 亲缘 
关系 的 进程 间 ) 。 在 以 后 各 章 具 体 讲 述 其 他 形式 的 IPC 时 ， 我 们 将 使 用 
另外 的 命名 约定 。 对 于 一 种 给 定 的 IPC 类 型 ， 其 可 能 的 名 字 的 集合 称 关 
它 的 名 字 空 间 (namespace) 。 名 字 空 间 非 常 重要 ， 因 为 对 于 除 普通 管 
道 以 外 的 所 有 形式 的 IPC 来 说 ， 名 字 是 客户 与 服务 句 人 彼 此 连接 以 交换 消 
息 的 手段 。 
图 1-4 汇 总 了 不 同形 式 的 IPC 所 用 的 命名 约定 。 
我 们 还 指出 哪些 形式 的 IPC 是 由 1996 年 版 的 Posix.1 和 Unix 98 标 准 化 
的 ， 这 两 个 标准 本 身 则 在 1.7 节 详细 讨论 。 为 了 比较 的 目的 ， 我 们 还 包 
含 了 三 种 类 型 的 套 接 字 ， 它 们 在 UNPv1 中 具体 讲述 。 注 意 套 接 字 API 
(应 用 程序 编程 接口 ) 是 由 Posix.1g 工 作 组 标准 化 的 ， 最 终 应 该 成 为 某 
个 未 来 的 Posix.1 标 准 的 一 部 分 。 


hed 用 于 打开 或 创建 MN k 


管道 (没有 名 字 ) 

FIFO 路 径 名 描述 符 

Posix 互 斥 锁 (没有 名 字 ) pthread mutex t 指 针 
Posix 条 件 变 量 (没有 名 字 ) pthread cond t 指 针 
Posix 读 写 锁 (没有 名 字 ) pthread rwlock t 指 针 
fcnt1 记 录 上 锁 路 径 名 描述 符 


Posix 消 息 队 列 Posix IPC 名 字 mga tff 
Posix 有 名 信号 量 Posix IPC 名 字 sem t 指 针 


Posix 基 于 内 存 的 信号 量 (没有 名 字 ) sem_t 指 针 
Posix 共 享 内 存 区 Posix IPC 名 字 描述 符 
System V 消 息 队 列 System V IPC 标 识 符 
System V 信 号 量 System V IPC 标 识 符 
System V 共 享 内 存 区 System V IPC 标 识 符 


门 路 径 名 描述 符 
Sun RPC 星 序 / 版 本 RPC 人 句柄 


TCP 套 接 字 IP 地 址 与 TCP 端 口 描述 符 
UDP 套 接 字 了 地 址 与 UDP 端口 描述 符 
Unix 域 套 接 字 路 径 名 描述 符 


图 1-4 各 种 形式 IPC 的 名 字 空 间 
尽管 Posix.1 标 准 化 了 信号 量 ， 它 们 仍然 是 可 选 的 特性 。 图 1-5 汇 总 
了 Posix.1 和 Unix 98 对 各 种 IPC 特 性 的 说 明 。 每 种 特性 有 强制 、 未 定义 和 
可 选 三 种 选择 。 对 于 可 选 的 特性 ， 我 们 指出 了 其 中 每 种 特性 受 文 持 时 
(aH "i$ 7E <unistd.h> 3k X fF F) 定义 的 常 值 的 名 字 ， 例 如 
POSIX THREADS 。 注 意 ，Unix 98 是 Posix.1 的 超 集 o 


IPC 类 型 


Posix 互 斥 锁 
Posix 条 件 变量 
进程 间 共 享 的 互 斥 锁 / 条 件 变 量 
Posix 读 写 锁 
fcnt1 记 录 上 锁 


POSIX THREADS 
POSIX THREADS 


_ POSIX THREADS PROCESS SHARED 


(未 定义 ) 
强制 


强制 
强制 


强制 
强制 
强制 
强制 
强制 
强制 
强制 


_XOPEN REALTIME 


Posix 消 息 队 列 


_POSIX MESSAGE PASSING 


POSIX SEMAPHORES .XOPEN REALTIME 


Posix 信 和 号 量 
Posix 共 享 内 存 区 POSIX SHARED MEMORY OBJECTS 
System V 消 息 队 列 Y 强制 
System V 信 和 号 量 未 定 》 强制 
System V 共 享 内 存 区 EX 强制 


门 (未 定义 ) 
LIEN (未 定义 ) ery 
POSIX MAPPED FILESK 强制 


_POSIX | SHARED | MEMORY | OBJECTS 
图 1-5 各 种 形式 IPC 的 可 用 性 


_XOPEN_REALTIME 


a T 


我 们 需要 理解 fork ` exec#il_exit 
的 影响 (_exit 是 由 exit 调 用 的 一 个 函数 ) 


六 数 对 于 所 讨论 的 各 种 形式 的 IPC 
o 图 1-6 对 此 作 了 总 结 。 


VOR 


子 进 程 取得 父 进程 的 所 有 打 
开 着 的 描述 符 的 副本 


Posix 消 息 队 列 


子 进程 取得 父 进程 的 所 有 打 
开 着 的 消息 队列 描述 符 的 副本 


所 有 打开 着 的 描述 符 继续 
打开 着 ， 除 非 已 设置 描述 符 
的 FD_CLOEXEC 位 

关闭 所 有 打开 着 的 消息 队 
列 描述 符 


关闭 所 有 打开 着 的 描述 
符 ， 最 后 一 个 关闭 时 删除 管 
道 或 FIFO 中 残留 的 所 有 数据 

关闭 所 有 打开 着 的 消息 队 
列 描述 符 


System V 消 息 队列 | ”没有 效果 没有 效果 没有 效果 


Posix H Jf Hi Al & 
件 变量 


Posix 基 于 内 存 的 
信号 量 


若 驻 留 在 共享 内 存 区 中 而 且 
具有 进程 间 共 享 属性 ， 则 共享 


若 驻 留 在 共享 内 存 区 中 而 且 
具有 进程 间 共享 属性 ， 则 共享 


若 驻 留 在 共享 内 存 区 中 而 且 
具有 进程 间 共 享 属性 ， 则 共享 


父 进程 中 所 有 打开 着 的 有 名 
信和 号 量 在 子 进程 中 继续 打开 着 
System V 信 号 量 子 进 程 中 所 有 semadj 值 都 置 
为 0 

了 进程 不 继承 由 父 进程 持 有 


fcnt1 记 录 上 锁 
| 的 锁 
mmap 内 存 映 射 父 进 程 中 的 内 存 映 射 存留 到 
子 进程 中 


Posix 共 享 内 存 区 父 进 程 中 的 内 存 映 射 存留 到 
子 进程 中 

附 接 着 的 共享 内 存 区 在 子 进 
程 中 继续 附 接着 

子 进 程 取 得 父 进程 的 所 有 打 
开 着 的 描述 符 ， 但 是 客户 在 门 
描述 符 上 激活 其 过 程 时 ， 只 有 
父 进程 是 服务 器 


Posix 有 名 信和 号 量 


System V 共 享 内 
存 区 


除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 县 有 进程 间 共 
Xm. gi 

除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 具 有 进程 间 共 
享 属性 ， 否 则 消失 

除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 具 有 进程 间 共 
享 属性 ， 和 否则 消失 

关闭 所 有 打开 着 的 有 名 
信号 量 

所 有 semadj (fti 185455 AH 
程序 中 

只 要 描述 符 继续 打开 着 ， 
BU ANE 

去 除 内 存 映 射 


去 除 内 存 映射 


断 开 所 有 附 接着 的 共享 
内 存 区 

所 有 门 描述 符 都 应 关闭 , 因 
为 它们 创建 时 设置 了 
FD_CLOEXEC 位 


图 1-6 调用 fork、exec 和 _exit 对 于 IPC 的 影响 


除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 有 具有 进程 间 共 
享 属 性 ， 否 则 消失 

除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 具 有 进程 间 共 
享 属性 ， 否 则 消失 

除非 在 继续 打开 着 的 共享 
内 存 区 中 而 且 具 有 进程 间 共 
Stk, quA 

关闭 所 有 打开 着 的 有 名 
信和 号 量 

所 有 semadj 值 都 加 到 相应 
mist 

解 开 由 进程 持 有 的 所 有 未 
处 理 的 锁 


去 除 内 存 映 射 
EPRA TEMY 


断 开 所 有 附 接着 的 共享 
内 存 区 
关闭 所 有 打开 着 的 描述 符 


表 中 多 数 特性 将 在 以 后 的 章节 中 讲述 ， 不 过 我 们 需要 强调 几 点 。 
首先 ， 考 虑 到 无 名 同步 变量 〈 互 斥 锁 、 条 件 变 量 、 
的 信号 量 ) ， 从 一 个 具有 多 个 线程 的 进程 中 调用 fork 将 变 得 混乱 不 堪 。 

[Butenhof 1997] 的 6.1 节 提供 了 其 中 的 细节 。 我 们 在 表 中 只 是 简单 地 
注 明 : 如 果 这 些 变量 驻 留 在 共享 内 存 区 中 ， 而 且 创 建 时 设置 了 进程 间 
共享 属性 ， 那 么 对 于 能 访问 该 共享 内 存 区 的 任意 进程 来 说 ， 其 任意 线 


程 能 继续 访问 这 些 变量 


BES BL SETAE 


o EX, System V IPC 的 三 种 形式 没有 打开 或 关 


闭 的 说 法 。 我 们 将 从 图 6-8 和 习题 11.1 和 习题 14.1 中 看 出 ， 访 问 这 三 种 形 
式 的 IPC 所 需 知道 的 只 是 一 个 标识 符 ， 因 此 知道 该 标识 符 的 任何 进程 都 
能 访问 它们 ， 尽 管 信号 量 和 共享 内 存 区 可 附带 提出 某 种 特殊 处 理 要 
p o 


1.6 出 错 处 理 : URRA 


在 现实 程序 中 ， 我 们 必须 检查 每 个 函数 调用 是 否 返 回 错误 。 由 于 
页 到 错误 时 终止 程序 执行 是 个 惯例 ， 因 此 我 们 可 以 通过 定义 包 于 函数 
(wrapper function) 来 缩短 程序 的 长 度 。 包 于 函数 执行 实际 的 函数 调 
用 ， 测 试 其 返回 值 ， 并 在 碰 到 错误 时 终止 进程 。 我 们 使 用 的 命名 约定 
是 将 函数 名 第 一 个 字母 改 为 大 写字 母 ， 例 如 : 
Sem post(ptr); 
E|1-74E X. T xx T ZENA © 


lib/wrapunix.c 


387 void 

388 Sem post(sem t *sem) 

389 ( 

390 if (sem post(sem) -- -1) 

391 err sys("sem post error"); 

392 } 

lib/wrapunix.c 


图 1-7 sem. postER ZXE' LE ER AX 

每 当 你 遇 到 一 个 以 大 写字 母 打 头 的 函数 名 时 ， 它 瓯 是 我 们 所 说 的 
包 囊 函数 。 它 调用 一 个 名 字 相 同 但 以 相应 小 写字 母 开 头 的 实际 函数 。 
SARIN, SRA ee RT UE TH SAI © 

我 们 在 讲解 书 中 提供 的 源 代码 时 ， 所 指 代 的 总 是 被 调用 的 最 低层 
函数 (例如 sem_post) ， 而 不 是 包 囊 函数 (例如 Sem_post) 。 类 似 地 ， 
书后 的 索引 也 总 是 指 代 被 调用 的 最 低层 函数 ， 而 不 是 指 代 包 襄 函数 。 

刚刚 展示 的 源 代码 格式 全 书 都 在 使 用 。 每 一 非 空 行 都 被 编号 。 代 
码 的 正文 说 明 部 分 的 左边 标 有 起 始 与 结束 的 行 号 。 有 的 段落 开始 处 含 


有 一 个 醒目 的 简短 标题 ， 概 述 本 段 代码 的 内 容 。 

源 代码 片段 起 始 与 结束 处 的 水 平 划 线 标 出 了 该 片段 所 在 源 代码 文 
件 名 ， 本 例 中 就 是 lib 目 录 下 的 wrapunix.c 文 件 。 既 然 本 书 所 有 例子 的 源 
代码 都 可 免费 获得 〈 见 前 言 ) ， 你 就 可 以 赁 这 个 文件 名 找到 相应 的 文 
件 。 阅 读本 书 的 过 程 中 ， 编 译 、 运 行 并 修改 这 些 程序 是 学 习 进 程 间 通 
信和 概念 的 好 方法 。 

尽管 包 正 函数 不 见得 如 何 节 省 代码 量 ， 当 在 第 7 莫 中 讨论 线程 时 ， 
我 们 会 发 现 线程 函数 出 错时 并 不 设置 标准 的 Unix errno E; 相反 ， 本 
该 设置 errno 的 值 改 由 线程 画 数 作为 其 返回 值 返 回调 用 者 。 这 意味 着 我 
们 每 次 调用 任意 一 个 线程 函数 时 ， 都 得 分 配 一 个 变量 来 保存 函数 返回 
值 ， 然 后 在 调用 我 们 的 err_sys 函 数 (图 C-4) 前 ， 把 errno 设 置 成 所 保存 
的 值 。 为 避免 源 代 码 中 到 处 出 现 花 括 弧 ， 我 们 可 以 使 用 C 语 言 的 逗号 运 
算 符 ， 把 给 errno 赋 值 与 调用 err_sys 组 合成 单个 语句 ， 如 下 所 示 : 


int n; 


if ( (n = pthread mutex lock(&ndone mutex))!- 0) 
errno 7 n,err sys("pthread mutex lock error"); 
另 一 种 办 法 是 定义 一 个 新 的 出 错 处 理 函 数 ， 它 需要 的 另 一 个 参数 
是 系统 的 错误 号 [1]。 但 是 我 们 可 以 将 这 段 代码 简化 得 更 容易 些 : 
Pthread mutex lock(&ndone mutex); 
其 前 提 是 定义 目 己 的 包 右 函数 ， 如 图 1-8 所 示 。 


lib/wrappthread.c 


125 void 


126 Pthread mutex lock(pthread mutex t *mptr) 
127 { 

128 int n; 

129 if ( (n = pthread mutex lock(mptr)) == 0) 
130 return; 

131 errno - n; 

132 err sys("pthread mutex lock error"); 

133 } 


lib/wrappthread.c 


图 1-8 给 pthread_mutex_lock 定 义 的 包 误 函数 


仔细 推 殴 编码 ， 我 们 可 改 用 宏 代 替 函 数 ， 从 而 稍稍 提高 运行 效 
率 ， 不 过 即使 有 过 的 话 ， 包 庄 函 数 也 很 少 是 程序 性 能 的 瓶 绒 所 在 。 

选择 将 函数 名 的 第 一 个 字母 大 写 是 一 种 较 折 中 的 方法 。 还 有 许多 
其 他 方法 : 例如 用 e 作 为 函数 名 的 前 组 (如 [Kernighan and Pike 1984. 
第 184 页 所 示 ) ， 或 者 用 _e 作 为 函数 名 的 后 缀 等 。 同 样 提 供 确实 在 调用 
某 个 其 他 函数 的 可 视 化 指示 ， 我 们 的 方法 看 来 是 最 少 分 散人 们 的 注意 
力 的 。 

这 种 技巧 还 有 助 于 检查 那些 其 错误 返回 值 通 种 被 名 略 的 函数 ， 例 
如 close 和 pthread_mutex_lock。 

本 书后 面 的 例子 中 我 们 将 普 所 使 用 包 右 范 数 ， 除 非 必 须 检 查 某 个 
确定 的 错误 并 处 理 它 (而 不 是 终止 进程 ，》。 我 们 并 不 给 出 所 有 包 衰 函 
数 的 源 代码 ， 但 它们 是 免费 可 得 的 〈 见 前 言 ) 。 

Unix errno 值 

每 当 在 一 个 Unix 函 数 中 发 生 错 误 时 ， 全 局 变量 errno 将 被 设置 成 一 
个 指示 错误 类 型 的 正 数 ， 画 数 本 身 则 通 第 返回 -1。 我 们 的 err_sys 函 数 检 
查 errno 的 值 并 输出 相应 的 出 错 消息 ， 例 如 ， errno 的 值 等 于 EAGAIN 时 
的 出 错 消息 为 “Resource temporarily unavailable" (资源 暂时 不 可 用 ) ° 

errmo 的 值 只 在 某 个 函数 发 生 错 误 时 设置 。 如 采 该 画 数 不 返回 鲁 
误 ，ermo 的 值 束 无 定义 。 所 有 正 的 错误 值 都 是 常 值 ， 具 有 以 E 打 头 的 全 
部 为 大 写字 母 的 名 字 ， 通 党 定义 在 头 文件 <sys/errno.h> 中 。 没 有 值 为 0 
的 错误 。 

在 多 线程 环境 中 ， 每 个 线程 必须 有 目 己 的 erno 变 量 。 提 供 一 个 局 
限于 线程 的 errno 变 量 的 隐 式 请 求 是 自动 处 理 的 ， 不 过 通常 需要 告诉 编 
译 器 所 编译 的 程序 是 可 重 入 的 。 给 编译 器 指定 类 似 -D_REENTRANT 或 - 
D_POSIX_C_SOURCE=199506L 这 样 的 命令 行 选项 是 较 典 型 的 方法 。 
<errno.h> 头 文件 往往 把 ermo 定 义 成 一 个 安 ， 当 稍 值 REENTRANT 有 有 定 


义 时 ， 该 宏 就 扩展 成 一 个 函数 ， 由 它 访问 errmno 变 量 的 某 个 局 限于 线程 
的 副本 。 

E EEH R *mq. send ER ZIG& [EIEMSGSIZE TE E" BP] FH TER f] Ri Hh 
表示 这 样 的 意思 : 该 函数 返回 一 个 错误 〈 典 型 情况 是 返回 值 为 -1) , Jf 
有 昌 在 ermo 中 设置 了 指定 的 常 值 。 


1.7 Unix 标 


有 天 Unix 标 准 化 的 大 多 数 活 动 古 由 Posix 和 Open Group 做 的 。 

1.7.1 Posix 

Posix 是 “可 移植 操作 系统 接口 ”(Portable Operating System 
Interface) 的 首 字母 缩写 。 它 并 不 是 一 个 单一 标准 ， 而 是 一 个 由 电气 与 
电子 工程 师 学 会 即 IEEE 开 发 的 一 系列 标准 。Posix 标 准 还 是 由 ISO (E 
际 标准 化 组 织 ) 和 IEC (国际 电工 委员 会 ) 采纳 的 国际 标准 ， 这 两 个 组 
织 合 称 为 ISO/IEC。Posix 标 准 经 历 了 以 下 若干 代 。 

IEEE Std 1003.1-1988 (3531771) 是 第 一 个 Posix 标 准 。 它 说 明 进入 
类 Unix 内 核 的 C 语 言 接 口 ， 涉 及 下 列 领 域 ， 进 程 原 语 (fork、exec、 信 
号 、 定 时 器 ) 、 进 程 环境 〈 用 户 ID、 进 程 组 ) 、 文 件 与 目录 (所 有 IO 
函数 ) 、 终 端 O、 系 统 数据 库 (口令 文件 和 用 户 组 文件 ) 、tar 与 cpio 
归档 格式 。 

第 一 个 Posix 标 准 是 出 现 于 1986 年 称 为 “TEEEIX” 的 试用 版 本 。Posix 
这 个 名 字 是 由 Richard Stallman 建 议 使 用 的 。 

IEEE Std 1003.1-1990 ( 共 356 页 ) 是 下 一 个 Posix 标 准 ， 它 也 是 国际 
标准 ISO/TEC 9945-1:1990。 从 1988 年 版 本 到 1990 年 版 本 只 做 了 少量 的 修 
改 。 新 添 的 副标题 为 “Part 1: System Application Program Interface (API) 
[C Language]”， 指 示 本 标准 为 C 语 言 API 。 


IEEE Std 1003.2-1992 出 版 成 两 卷 本 ， 共 约 1300 页 ， 其 副标题 为 
“Part2: Shell and Utilities" ° 3x — 5547 XE X. T shell (2&4 System V 的 
Bourne shell) 和 大 约 100 个 实用 程序 ( 即 通 常 从 shell 启 动 执行 的 程序 ， 
包括 awk、basename、vi 和 yacc 等 ) 。 本 书 称 这 个 标准 为 Posix.2。 

IEEE Std 1003.1b-1993 ( 共 590 页 ) 先前 称 为 IEEE P1003.4。 这 是 对 
1003.1-1990 标 准 的 更 新 ， 添 加 了 由 P1003.4 工 作 组 开发 的 实时 扩展 : 文 
件 同步 、 异 步 WO、 信 号 量 、 内 存 管理 (mmap 和 共享 内 存 区 ) 、 执 行 调 
度 、 时 钟 与 定时 器 、 消 息 队 列 。 

IEEE Std 1003.1，1996 年 版 [IEEE 1996] 包括 1003.1-1990 (基本 
API) 、1003.lb-1993 (实时 扩展 ) 、1003.1c-1995 (Pthreads) 和 
1003.1i-1995 (对 1003.1b 的 技术 性 修正 ) 。 这 个 标准 也 称 为 ISO/IEC 
9945-1: 1996。 其 中 增加 了 三 章 线程 内 容 以 及 有 关 线 程 同 步 〈 互 斥 锁 和 
条 件 变 量 ) 、 线 程 调 度 和 同步 调度 的 额外 各 节 。 本 书 称 这 个 标准 为 
Posix.1 ? 

743 页 中 有 四 分 之 一 强 的 篇 幅 是 标题 为 “Rationale and Notes” (JE 
与 注解 ) 的 附录 。 这 些 原 理 含有 历史 性 信息 以 及 某 些 特性 必须 加 入 或 
删除 的 理由 ， 它 们 通常 跟 正式 标准 一 样 有 教 益 。 

遗憾 的 是 EE 标准 在 因特网 上 不 是 免费 可 得 的 。 其 订购 信息 在 

[IEEE 1996]. 的 参考 文献 说 明 中 给 出 。 

注意 信号 量 在 实时 标准 中 定义 ， 它 与 在 Pthreads 标 准 中 定义 的 互 不 
锁 和 条 件 变 量 相 分 离 ， 这 足以 解释 它们 的 API 中 存在 的 某 些 差异 。 

最 后 注意 读 写 锁 〈 尚 ) 不 属于 任何 Posix 标 准 。 我 们 将 在 第 8 章 中 详 
Zt ie 。 

将 来 某 个 时 候 印 制 的 新 版 本 的 IEEE Std 1003.1 应 包括 P1003.lg 标 
准 ， 它 是 我 们 在 UNPvl 中 讲述 的 网 络 编程 API ( 套 接 字 和 XTI) 

1996 年 版 的 Posix.1 标 准 的 前 言 中 声称 ISO/IEC 9945 由 下 面 三 个 部 分 
构成 。 


Part 1: System application program interface (APD[C Language] (第 
一 部 分 : 系统 应 用 程序 接口 (APD [CIBHD 。 

Part 2: Shell and utilities (第 二 部 分 : Shell 和 实用 程序 ) 。 

Part 3: System administration 〈 第 三 部 分 : 系统 管理 ) 《正在 开发 
Es ve 

第 一 部 分 和 第 二 部 分 就 是 我 们 所 称 的 Posix.1 和 Posix.2。 

Posix 标 准 化 工作 仍 将 继续 ， 任 何 论 述 到 它 的 书籍 都 在 跟 躁 这 项 工 
作 。 从 http://www.pasc.org/standing/sdll.html 可 获得 各 种 Posix 标 准 的 最 新 
状态 。 

1.7.2 Open Group 

Open Group 是 由 X/Open 公司 (1984 年 成 立 ) 和 开放 软件 基金 会 

(OSF, 1988F) 于 1996 年 合并 而 成 的 组 织 。 它 是 由 三家、 业界 最 

终 用 户 、 政 府 部 门 和 学 术 机 构 组 成 的 国际 组 织 。 它 们 的 标准 经 历 了 以 
PEFR ° 

X/Open 公司 于 1989 年 出 版 了 “X/Open Portability Guide” ( X/Open 
移植 性 指南 》) 第 3 期 (XPG3) 。 

第 4 期 于 1992 年 出 版 ， 这 一 期 的 第 2 版 于 1994 年 出 版 。 这 个 最 终 版 
本 也 称 为 “Spec 1170”"， 其 中 魔 数 1170 是 系统 接口 数 (926 个 ) 、 头 文件 
数 (70 个 ) 和 命令 数 (174 个 ) 的 总 和 。 这 组 规范 的 最 终 名 字 是 
“X/Open Single Unix Specification" (X/Open/& —UnixZ 15) ， 也 称 为 
“Unix 95” ° 

1997 年 3 月 单一 Unix 规 范 的 第 2 版 发 表 。 符 合 这 个 规范 的 产品 可 称 
为 “Unix 98”， 这 也 是 本 书 提 到 这 个 规范 所 用 的 名 称 。Unix 98 所 需 的 接 
口 数 从 1170 个 增加 到 1434 个 ， 然 而 ， 适 用 于 工作 站 的 接口 数 却 猛 增 到 
3030 个 ， 为 它 包 含 CDE (AF i X BE, Common Desktop 
Environment) ， 而 CDE 又 反 过 来 要 求 有 X Windows 系 统 和 Motif 用 户 接 


口 。 其 详情 见 [ Josey 1997 | 和 http : /www.UNIX- 
systems.org/version2 ° 

单一 Unix 规 范 的 许多 文档 可 在 因特网 上 从 这 个 站 点 免费 取得 。 

1.7.3 Unix 版 本 和 移植 性 

当今 大 多 数 Unix 系 统 符合 Posix.1 和 Posix.2 的 某 个 版 本 。 我 们 使 用 
限定 词 “ 某 个 ”是 因为 Posix 每 次 更 新 (例如 1993 年 增加 实时 扩展 ，1996 
年 增加 Pthreads 内 容 ) ， 广 家 都 得 花 一 两 年 (甚至 更 长 的 时 间 ) 去 实现 
并 加 入 最 近 的 更 新 内 容 。 

从 历史 上 看 ， 多 数 Unix 系 统 或 者 源 自 Berkeley， 或 者 源 目 System 
V， 不 过 这 些 差 别 在 慢 慢 消失 ， 因 为 大 多 数 上 厂家 已 开始 采用 Posix 标 
准 。 仍 然 存 在 的 主要 差别 在 于 系统 管理 ， 这 是 一 个 目前 还 没有 任何 
Posix 标 准 可 循 的 领域 。 

运行 本 书 中 大 多 数 例子 的 平台 是 Solaris 2.6 和 Digital Unix 4.0B。 其 
原因 在 于 写 到 此 处 时 (1997 年 末 到 1998 年 初 ) ， 只 有 这 两 种 Unix 系 统 
支持 System V IPC ` Posix IPC 及 Posix 线 程 。 


1.8 书 中 IPC 例 子 索 引 表 


为 分 析 各 种 特性 ， 全 书 主要 使 用 了 三 种 交互 模式 。 

(1) 文 件 服务 器 : 客户 -服务 器 应 用 程序 ， 客 户 向 服务 器 发 送 一 个 路 
径 名 ， 服 务 夯 把 该 文件 的 内 容 返 回 给 客户 。 

(2) 生 产 者 -消费 者 :一 个 或 多 个 线程 或 进程 (生产 者 ) 把 数据 放 到 
一 个 共 至 缓冲 区 中 ， 男 有 一 个 或 多 个 线程 或 进程 (消费 者 ) 对 该 共享 
缓冲 区 中 的 数据 进行 操作 。 

(3) 序 列 号 持续 增 1， 一 个 或 多 个 线程 或 进程 给 一 个 共享 的 序列 号 持 
续 增 1。 该 序列 号 有 时 在 一 个 共享 文件 中 ， 有 时 在 共享 内 存 区 中 。 


第 一 个 例子 分 析 各 种 形式 的 消息 传递 ， 另 外 两 个 例子 则 分 析 各 种 
类 型 的 同步 和 共享 内 存 区 。 

Fy T fe GEAR 5 Pri ss 7S IR] ELA ZR 51, BÉd1-9 ^ Bd1-10 0 Ed 1-11 
汇总 了 我 们 开发 的 程序 及 它们 的 源 代码 所 在 的 起 始 图 号 和 页 码 。 


使 用 两 个 管道 ， 父 子 进程 间 

使 用 popen 和 cat 

使 用 两 个 FIFO， 父 子 进程 间 

使 用 两 个 FIFO， 独 立 的 服务 器 ， 与 服务 器 无 亲缘 关系 的 客户 


使 用 多 个 FIFO， 独 立 的 迭代 服务 器 ， 多 个 客户 
使 用 管道 或 FIFO: 在 字 节 流 上 构筑 记录 

使 用 两 个 System V 消 息 队 列 

使 用 一 个 System V 消 息 队 列 ， 多 个 客户 

每 个 客户 使 用 一 个 System V 消 息 队 列 ， 多 个 客户 
使 用 穿越 门 的 描述 符 传递 


图 1-9 不 同 版 本 的 文件 服务 器 客户 -服务 器 例子 


只 用 互 斥 锁 ， 多 个 生产 者 ， 单 个 消费 者 
互 斥 锁 和 条 件 变量 ， 多 个 生产 者 ， 单 个 消费 者 
Posix 有 名 信号 量 ， 单 个 生产 者 ， 单 个 消费 者 


Posix 基 于 内 存 的 信号 量 ， 单 个 生产 者 ， 单 个 消费 者 
Posix 基 于 内 存 的 信号 量 ， 多 个 生产 者 ， 单 个 消费 者 
Posix 基 于 内 存 的 信号 量 ， 多 个 生产 者 ， 多 个 消费 者 
Posix 基 于 内 存 的 信号 量 ， 单 个 生产 者 ， 单 个 消费 者 ， 多 个 缓冲 区 


图 1-10 不 同 版 本 的 生产 者 -消费 者 例子 


序列 号 在 文件 中 ， 不 上 锁 

序列 号 在 文件 中 ，fcnt1 上 锁 

序列 号 在 文件 中 ， 使 用 open 进 行文 件 系 统 上 锁 
序列 号 在 文件 中 ，Posix 有 名 信和 号 量 上 锁 

序列 号 在 mmap 共 享 内 存 区 ，Posix 有 名 信和 号 量 上 锁 

序列 号 在 mmap 共 享 内 存 区 ，Posix 基 于 内 存 的 信号 量 上 锁 
序列 号 在 4.4BSD 匿 名 共享 内 存 区 ，Posix 有 名 信和 号 量 上 锁 
序列 号 在 SVR4/aev/zetro 共 享 内 存 区 ，Posix 有 名 信和 号 量 上 锁 
序列 号 在 Posix 共 享 内 存 区 ，Posix 基 于 内 存 的 信号 量 上 锁 
性 能 测量 : 线程 间 互 斥 锁 上 锁 

性 能 测量 ; 线程 间 读 写 锁 上 锁 

性 能 测量 ; 线程 间 Posix 基 于 内 存 的 信号 量 上 锁 
性 能 测量 ， 线程 间 Posix 有 名 信号 量 上 锁 

性 能 测量 : 线程 间 System V 信 号 量 上 锁 

性 能 测量 : 线程 间 fcnt1 记 录 上 锁 

性 能 测量 ; 线程 间 互 斥 锁 上 锁 


图 1-11 不 同 版 本 的 序列 号 持续 增 1 例子 


1.9 小 结 


IPC 传 统 上 是 Unix 中 一 个 杂乱 不 堪 的 领域 。 虽 然 有 了 各 种 各 样 的 解 
决 办 法 ， 但 没有 一 个 是 完美 的 。 我 们 的 讨论 分 成 4 个 主要 领域 : 

(1) 消 息 传递 (管道 、FIFO、 消 息 队 列 ) ; 

(2) 同 步 〈 互 斥 锁 、 条 件 变量 、 读 写 锁 、 信 和 号 量 ) ，; 

(3) 共 享 内 存 区 (匿名 共享 内 存 区 、 有 名 共享 内 存 区 ) ; 

(4) 过 程 调用 〈Solaris 门 、Sun RPC) ° 

我 们 考虑 单个 进程 中 多 个 线程 间 的 IPC 以 及 多 个 进程 间 的 IPC。 


各 种 类 型 IPC 的 持续 性 可 以 是 随 进程 持续 的 、 随 内 核 持续 的 或 随 文 
件 系 统 持续 的 ， 这 取决 于 IPC 对 象 存在 时 间 的 长 短 。 在 为 给 定 的 应 用 选 
择 所 用 的 IPC 类 型 时 ， 我 们 必须 清楚 相应 IPC 对 象 的 持续 性 。 

各 种 类 型 IPC 的 男 一 个 特性 是 名 字 空 间 ， 也 就 是 使 用 IPC 对 象 的 进 
程 和 线程 标识 各 个 IPC 对 象 的 方式 。 各 种 类 型 的 IPC 有 些 没有 名 字 US 
道 、 互 斥 锁 、 条 件 变量 、 读 写 锁 ) ， 有 些 具 有 在 文件 系统 中 的 名 字 

(FIFO) ， 有 些 具 有 将 在 第 2 章 中 讲述 的 Posix IPC 名 字 ， 有 些 则 具有 其 
他 类 型 的 名 字 〈 将 在 第 3 章 中 讲述 的 System V IPC 键 或 标识 符 ) 。 典 型 
做 法 是 : 服务 器 以 某 个 名 字 创 建 一 个 IPC 对 象 ， 客 户 则 使 用 该 名 字 访 问 
同一 个 IPC 对 象 。 

本 书 中 所 有 源 代 码 使 用 1.6 节 中 讲述 的 包 庄 函数 来 缩短 篇 幅 ， 同 时 
达到 检查 每 个 函数 调用 是 否 返 回 错误 的 目的 。 我 们 的 包 庄 画 数 都 以 一 
个 大 写字 母 开 头 。 

IEEE Posix 标 准 一 直 是 多 数 厂 家 努力 遵循 的 标准 ， 其 中 Posix.1 定 义 
了 访问 Unix 的 基本 C 接 口 ，Posix.2 定 义 了 标准 命令 。 然 而 商业 标准 也 在 
迅速 地 吸纳 并 扩展 Posix 标 准 ， 著 名 的 有 Open Group 的 Unix 标 准 ， 例 如 
Unix 98 ° 


习 


1.1 图 1-1 中 我 们 展示 了 两 个 进程 访问 单个 文件 的 情形 。 如 果 这 两 个 
进程 都 只 是 往 该 文件 的 末尾 添加 新 的 数据 ( 壁 如 说 这 是 一 个 日 志文 
件 ) ， 那 么 需要 什么 类 型 的 同步 ? 

1.2 查看 一 下 你 的 系统 中 的 <errorh> 头 文件 是 如 何 定义 errno 变 量 
的 。 

1.3 在 图 1-5 上 标注 出 你 使 用 的 Unix 系 统 所 文 持 的 特性 。 


第 2 章 Posix IPC 
2.1 概述 


以 下 三 种 类 型 的 IPC 合 称 为 “Posix IPC": 

Posix 消 息 队 列 (第 5 章 ) ; 

Posix 3 (5810) ; 

Posix 共 享 内 存 区 (13H) 。 

Posix IPC 在 访问 它们 的 函数 和 摘 述 它们 的 信息 上 有 一 些 类 似 点 。 
本 章 讲述 所 有 这 些 共 同属 性 : 用 于 标识 的 路 径 名 、 打 开 或 创建 时 指定 
的 标志 以 及 访问 权限 。 

图 2-1 汇 总 了 所 有 Posix IPCERZ © 


O |. Mil 共享 内 存 区 
XR 
at 4755 : H og X sem open shm open 
创建 、 打 开 或 删除 IPC 的 函数 sem close shm unlink 
i sem_unlink 


sem init 
sem destroy 
i mq getattr ftruncate 
PC 操作 的 丽 数 feram 


mq send sem wait mmap 
IPCHRTE PR 3 mq receive | sem trywait munmap 
mq notify sem post 
sem getvalue 


图 2-1 Posix IPCERZAGI H 
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在 图 1-4 中 我 们 指出 ， 三 种 类 型 的 Posix IPC 都 使 用 “Posix IPC F” 
进行 标识 。mq_open、sem_open 和 shm_open 这 三 个 函数 的 第 一 个 参数 


就 是 这 样 的 一 个 名 字 ， 它 可 能 是 某 个 文件 系统 中 的 一 个 真正 的 路 径 
名 ， 也 可 能 不 是 。Posix.1 是 这 么 描述 Posix IPC 名 字 的 。 

它 必须 符合 已 有 的 路 径 名 规则 (必须 最 多 由 PATH_MAX 个 字 市 构 
成 ， 所 括 结尾 的 空 字 节 ) 。 

如 果 它 以 斜 杠 符 开 头 ， 那 么 对 这 些 函 数 的 不 同调 用 将 访问 同一 个 
队列 。 如 果 它 不 以 斜 杠 符 开 头 ， 那 么 效果 取决 于 实现 。 

名 字 中 额外 的 斜 杠 符 的 解释 由 实现 定义 。 

因此 ， 为 便于 移植 起 见 ，Posix IPC 名 字 必 须 以 一 个 斜 杠 符 打 头 ， 
并 且 不 能 再 含有 任何 其 他 和 斜 杠 符 。 遗 憾 的 是 这 些 规则 还 不 够 ， 仍 会 出 
现 移植 性 问题 。 

Solaris 2.6 要 求 有 打头 的 斜 杠 符 ， 但 是 不 允许 有 另外 的 斜 杠 符 。 假 
设 要 创建 的 是 一 个 消息 队列 ， 创 建 男 数 将 在 /tmp 中 创建 三 个 以 .MQ 开 头 
的 文件 。 人 例如， 如果 给 mq_open 的 参数 为 /queue.1234， 那 么 这 三 个 文件 
分 Fill, 为  /tmp.MQDqueue1234 ` /tmp/.MQLqueue.1234 
和 /tmp/.MQPqueue.1234。Digita.Uni.4.0B 则 在 文件 系统 中 创建 所 指定 的 
路 径 名 。 

当 我 们 指定 一 个 只 有 单个 斜 杠 符 〈 作 为 首 字符 ) 的 名 字 时 ， 移 植 
性 问题 就 发 生 了 : 我 们 必须 在 根 目录 中 具有 写 权 限 。 例 如 ，/tmp.1234 
符合 Posix 规 则 ， 在 Solaris 下 也 可 行 ， 但 是 Digital Unix 却 会 试图 创建 这 
个 文件 ， 这 时 除非 我 们 有 在 根 目录 中 的 写 权 限 ， 否 则 这 样 的 尝试 将 失 
败 。 如 果 我 们 指定 一 个 /tmp/test.1234 这 样 的 名 字 ， 那 么 在 以 该 名 字 创 建 
一 个 真正 文件 的 所 有 系统 上 都 将 成 功 (前 提 是 /tmp 目 录 存 在 ， 而 且 我 们 
在 该 目录 中 有 写 权 限 ， 对 于 多 数 Unix 系 统 来 说 ， 这 是 正常 情况 ) ， 在 
Solaris 下 则 失败 。 

为 避免 这 些 移植 性 问题 ， 我 们 应 该 把 Posix IPC 名 字 的 #define 行 放 
在 一 个 便于 修改 的 头 文件 中 ， 这 样 应 用 程序 转移 到 另 一 个 系统 上 时 ， 
只 需 修改 这 个 头 文件 。 


这 是 一 个 标准 试图 变 得 相当 通用 (本 例子 中 ， 实 时 标准 试图 允许 
消息 队列 、 信 和 号 量 和 共享 内 存 区 都 在 现 有 的 Unix 内 核 中 实现 ， 而 且 在 
独立 的 无 盘 系 统 上 也 能 工作 ) ， 结 果 标 准 的 具体 实现 却 变 得 不 可 移植 
的 个 例 之 一 。 在 Posix 中 ， 这 种 现象 称 为 “造成 不 标准 的 标准 方式 ”(a 
standard way of being nonstandard) ° 

Posix.13€ X.  — T E: 

S TYPEISMQ(buf) 

S TYPEISSEM(buf) 

S TYPEISSHM(buf) 

它们 的 单个 参数 是 指向 某 个 stat 结 构 的 指针 ， 其 内 容 由 fstat ^ IstateX 
stat 这 三 个 函数 十 入 。 如 果 所 指定 的 了 PC 对 象 (消息 队列 、 信 号 量 或 共 
享 内 存 区 对 象 ) 是 作为 一 种 独特 的 文件 类 型 实现 的 ， 而 且 参 数 所 指向 
的 stat 结 构 访问 这 样 的 文件 类 型 ， 那 么 这 三 个 宏 计 算出 一 个 非 零 值 。 人 否 
则 ， 计 算出 的 值 为 0。 

不 科 的 是 ， 这 三 个 安 没有 多 大 用 处 ， 因 为 无 法 你 证 这 三 种 类 型 的 
IPC 使 用 一 种 独特 的 文件 类 型 实现 。 举 例 来 说 ， 在 Solaris 2.6 下 ， 这 三 个 
宏 的 计算 结果 总 是 0 。 

测试 某 个 文件 是 否 为 给 定 文 件 类 型 的 所 有 其 他 宏 的 名 字 都 以 S_IS 
开头 ， 而 且 它 们 的 单个 参数 是 某 个 stat 结 构 的 st_mode 成 员 。 由 于 上 面 三 
个 新 宏 的 参数 不 同 于 其 他 宏 ， 因 此 它们 的 名 字 改 为 以 S_TYPEIS 开 头 。 

px ipc nameEN2A 

解决 上 述 移植 性 问题 的 另 一 种 办 法 是 目 己 定义 一 个 名 为 
px_ipc_name 的 函数 ， 它 为 定位 Posix IPC 和 名字 而 添加 上 正确 的 前 缀 目 
录 。 


#include "unpipc.h" 


char *px ipc name(const char *name); 


HRE: 寿 成 功 则 为 非 空 指针 ， 奉 出 错 则 为 NULL 


本 书 中 我 们 给 自己 定义 的 非 标准 系统 函数 都 使 用 这 样 的 版 式 : 
绕 芳 数 原型 和 返回 值 的 方 框 是 虚 框 。 开 头 包 含 的 头 文 件 通 常 是 我 们 的 
unpipch (图 C-]) ° 

name 参 数 中 不 能 有 任何 斜 杜 符 。 例 如 ， 调 用 

px ipc name('test1") 

f£ Solaris 2.6 下 返回 一 个 指 癌 字 符 串 /testl 的 指针 ， 在 Digital Unix 
4.0B 下 返回 一 个 指向 字符 串 /tmp/test1 的 指针 。 存 放 结 果 字 符 串 的 内 存 
空间 是 动态 分 配 的 ， 并 可 通过 调用 free 释 放 。 另 外 ， 环 境 变 量 
PX_IPC_NAME 能 够 覆盖 默认 目录 。 
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lib/px ipc name.c 


1 include "unpipc.h" 

2 char * 

3 px ipc name(const char *name) 

4 { 

5 char *dir, *dst, *slash; 

6 if ( (dst - malloc(PATH MAX)) -- NULL) 

7 return (NULL); 

8 /* can override default directory with environment variable */ 
9 if ( (dir = getenv("PX IPC NAME")) == NULL) { 

10 #ifdef POSIX IPC PREFIX 

TT dir = POSIX_IPC_PREFIX; /* from "config.h" */ 

12 #else 

13 dir = "/tmp/"; /* default */ 

14 #endif 

15 } 

16 /* dir must end in a slash */ 

17 slash = (dir[strlen(dir) = 1] == '/') ? "" : "/"; 

18 snprintf (dst, PATH MAX, "%s%s%s", dir, slash, name); 

19 return (dst) ; /* caller can free() this pointer */ 
20 } 


lib/px ipc name.c 


图 2-2 Ri ]HJpx. ipe. nameER Zt 

这 也 许 是 你 第 一 次 碰 到 snprintf 函 数 。 许 多 现 有 代码 调用 的 是 
sprintfft， 但 是 sprintf 不 检查 目标 缓冲 区 是 否 洲 出 ， 不 过 snprintf 要 求 其 第 
二 个 参数 是 目标 缓冲 区 的 大 小 ， 因 此 可 确保 缓冲 区 不 洲 出 。 提 供 能 有 


意 洲 出 一 个 程序 的 sprintf 缓 冲 区 的 输入 数据 是 黑客 们 已 使 用 很 多 年 的 一 
种 攻破 系统 的 方法 。 

snprintf 不 是 标准 ANSI C 的 一 部 分 ， 但 这 个 标准 的 修订 版 C9X 正 在 
考虑 。 [2] 不 过 ， 许 多 广 家 提供 的 标准 C 函 数 库 含 有 这 个 函数 。 我 们 在 
本 书 中 使 用 snprintf ， 如 果 你 的 系统 不 提供 这 个 函数 ， 那 孢 使 用 我 们 目 
己 的 通过 调用 sprintf 实 现 的 版 本 。 


2.3 创建 与 打开 IPC 通 道 


mq_open、sem_open 和 shm_open 这 三 个 创建 或 打开 一 个 IPC 对 象 的 
函数 ， 它 们 的 名 为 oflag 的 第 二 个 参数 指定 怎样 打开 所 请 求 的 对 象 。 这 
与 标准 open 函 数 的 第 二 个 参数 类 似 。 图 2-3 给 出 了 可 组 合 构成 该 参数 的 
各 种 常 值 。 

前 3 行 指 定 怎 样 打 开 对 象 ， 只 读 、 只 写 或 读 写 。 消 上 息 队 列 能 以 其 中 
任何 一 种 模式 打开 ， 信 号 量 的 打开 不 指定 任何 模式 (任意 信号 量 操 


作 ， 都 需要 读 写 访问 权 ) ， 共 享 内 存 区 对 象 则 不 能 以 只 写 模 式 打 开 。 


mns | | . |omouy | — | 0 RDoNLY | RDONLY O RDONLY 
O WRONLY 
O RDWR O RDWR 


若 不 存在 则 创建 ”| O CREAT O CREAT O CREAT 
非 阻塞 模式 O NONBLOCK 


图 2-3 打开 或 创建 Posix IPC 对 象 所 用 的 各 种 oflag 常 值 


图 2-3 中 余下 4 行 标志 是 可 选 的 。 

O CREAT 若 不 存在 则 创建 由 芳 数 第 一 个 参数 所 指定 名 字 的 消息 队 
列 、 信 和 号 量 或 共享 内 存 区 对 象 (同时 检查 O_EXCL 标 志 ， 我 们 不 久 将 要 
说 明 ) e 

创建 一 个 新 的 消息 队列 、 信 号 量 或 共享 内 存 区 对 象 时 ， 至 少 需要 
另外 一 个 称 为 mode 的 参数 。 该 参数 指定 权限 位 ， 它 是 由 图 2-4 中 所 示 常 
值 按 位 或 形成 的 。 


| SrIRISR | WHE (me) ie | IRUSR RP en n 


S IRGRP ( 属 ) 成 员 读 
S IWGRP O8) 组 成 员 写 
S_IROTH 其 他 用 户 读 
S_IWOTH 其 他 用 户 写 


图 2-4 创建 新 的 IPC 对 象 所 用 的 mode 常 值 

这 些 常 值 定义 在 <sys/stat.h> 头 文件 中 。 所 指定 的 权限 位 受 当 前 进程 
的 文件 模式 创建 掩 码 (file mode creation mask) 修正 ， 而 该 掩 码 可 通过 
调用 umask 函 数 (APUE$883--8571 [3] ) 或 使 用 shell 的 umask 命 令 来 设 


He 
跟 新 创建 的 文件 一 样 ， 当 创建 一 个 新 的 消息 队列 、 mos 
内 存 区 对 象 时 ， 其 用 户 ID 被 置 为 当前 进程 的 有 效用 户 ID。 信 和 号 量 或 
Si les iain mi D e a — 
。 新 消息 队列 对 象 的 组 ID 则 被 置 为 当前 进程 的 有 效 组 ID (APUE 第 77 
A me dne 


这 三 种 Posix IPC 类 型 在 设置 组 ID 上 存在 的 差异 多 少 有 点 奇怪 。 由 
open 新 创建 的 文件 的 组 ID 或 者 是 当前 进程 的 有 效 组 ID ， 或 者 是 该 文件 
所 在 目录 的 组 ID， 但 是 IPC 函 数 不 能 假定 系统 为 IPC 对 象 创建 了 一 个 在 
文件 系统 中 的 路 径 名 。 

O EXCL 如 果 该 标志 和 O_CREAT 一 起 指定 ， 那 么 IPC 函 数 只 在 所 
指定 名 字 的 消息 队列 、 信 号 量 或 共享 内 存 区 对 象 不 存在 时 才 创 建新 的 
对 象 。 如 果 该 对 象 已 经 存在 ， 而 且 指 定 了 O_CREATIO_EXCL， 那 么 返 
回 一 个 EEXIST 错 误 。 

考虑 到 其 他 进程 的 存在 ， 检 查 所 指定 名 字 的 消息 队列 、 信 和 号 量 或 
共享 内 存 区 

对 象 的 存在 与 否 和 创建 它 (如 果 它 不 存在 ) 这 两 步 必 须 是 原子 的 

(atomic) 。 

我 们 将 在 3.4 节 看 到 适用 于 System V IPC 的 两 个 类 似 标志 。 

O_NONBLOCK 该 标志 使 得 一 个 消 恩 队列 在 队列 为 空 时 的 读 或 队 
列 填 满 时 的 写 不 被 阻塞 。 我 们 将 在 5.4 信 随 mq_receive 和 mq_send 这 两 个 
函数 详细 讨论 该 标志 。 

O TRUNC 如 有 果 以 读 写 模式 打开 了 一 个 已 存在 的 共享 内 存 区 对 象 ， 
那么 该 标志 将 使 得 该 对 象 的 长 度 被 截 成 0。 

图 2-5 展 示 了 打开 一 个 IPC 对 象 的 真正 逻辑 流程 。 我 们 将 在 2.4 广 通 
过 访问 权限 的 测试 说 明 该 图 。 图 2-6 是 展示 图 2-5 中 人 逻 辑 的 另 一 种 形式 。 


起 始 位 置 成 功 ， 创 建 了 新 对 象 


出 错 返 回 ， 
errno = ENOSPC 


新 对 象 被 创建 


出 错 返 回 ， 
errno = ENOENT 


出 错 返回 ， 
errno = EEXIST 


已 存在 对 象 被 引用 


出 错 返 回 ， 
errno = EACCES 


成 功 


图 2-5 打开 或 创建 一 个 IPC 对 象 的 逻辑 


无 特殊 标志 出 错 ，errno = ENOENT 成 功 ， 引 用 已 存在 对 象 


O CREAT 成 功 ， 创 建新 对 象 成 功 ， 引 用 已 存在 对 象 
O CREAT | O EXCL 成 功 ， 创 建新 对 象 HH, errno = EEXIST 


图 2-6 创建 或 打开 一 个 IPC 对 象 的 逻辑 

注意 图 2-6 指 定 了 O_CREAT 标 志 但 没有 指定 O_EXCL 标 志 的 中 间 那 
行 ， 我 们 无 法 得 到 一 个 指示 以 判别 是 创建 了 一 个 新 对 象 ， 还 是 在 引用 
一 个 已 存在 的 对 象 。 


新 的 消息 队列 、 有 和 名 信号 量 或 共享 内 存 区 对 象 是 由 其 oflag 参 数 中 
& HO CREATTTx Hjmq open ^ sem opengEXshm openÉN Zi GI AY » WW 


图 2-4 所 示 ， 权 限 位 与 这 些 IPC 类 型 的 每 个 对 象 相关 联 ， 就 像 它 们 与 每 
个 Unix 文 件 相 关联 一 样 。 

当 同 样 由 这 三 个 函数 打开 一 个 已 存在 的 消息 队列 、 信 号 量 或 共享 
内 存 区 对 象 时 (或 者 未 指定 O_CREAT， 或 者 指定 了 O_CREAT 但 没有 指 
定 O_EXCL， 同 时 对 象 已 经 存在 ) ， 将 基于 如 下 信息 执行 权限 测试 : 

(创建 时 赋予 该 ITPC 对 象 的 权限 位 ; 

(2) 所 请 求 的 访问 类 型 ( O RDONLY ^ O WRONLY 或 
O RDWR) ; 

(3) 调 用 进程 的 有 效用 户 ID、 有 效 组 ID 以 及 各 个 辅助 组 ID (车 支持 
的 话 ) 。 

大 多 数 Unix 内 核 按 如 下 步骤 执行 权限 测试 。 

(如 果 当 前 进程 的 有 效用 户 ID 为 0 (超级 用 户 ) ， 那 就 允许 访问 。 

(2) 在 当前 进程 的 有 效用 户 ID 等 于 该 IPC 对 象 的 属 主 ID 的 前 提 下 ， 如 
果 相应 的 用 户 访问 权限 位 已 设置 ， 那 就 允许 访问 ， 否 则 拒绝 访问 。 

这 里 相应 的 访问 权限 位 的 意思 是 : 如 有 果 当 前 进程 为 读 访问 而 打开 
该 IPC 对 象 ， 那 么 用 户 读 权限 位 必须 设置 ， 如 果 当 前 进程 为 写 访问 而 打 
开 该 PC 对象， 那么 用 户 写 权限 位 必须 设置 。 

(3) 在 当前 进程 的 有 效 组 ID 或 它 的 某 个 辅助 组 ID 等 于 该 ITPC 对 象 的 组 
ID 的 前 提 下 ， 如 果 相 应 的 组 访问 权限 位 已 设置 ， 那 就 允许 访问 ， 否 则 
拒绝 访问 。 

(4) 如 果 相 应 的 其 他 用 户 访问 权限 位 已 设置 ， 那 就 允许 访问 ， 否 则 
拒绝 访问 。 

这 4 个 步骤 是 按 所 列 的 顺序 党 试 的 。 因 此 ， 如 果 当 前 进程 拥有 该 
IPC 对 象 (38275) ， 那 么 访问 权 的 授予 与 拒绝 只 依赖 于 用 户 访问 权限 
一 一 组 访问 权限 绝 不 会 考虑 。 类 似 地 ， 如 果 当 前 进程 不 拥有 该 IPC 对 
象 ， 但 它 属 于 某 个 合适 的 组 ， 那 么 访问 权 的 授予 与 拒绝 只 依赖 于 组 访 
问 权 限 一 一 其 他 用 户 访 问 权 限 绝 不 会 考虑 。 


我 们 从 图 2-3 中 指出 ，sem_open 不 使 用 O_RDONLY 、O_WRONLY 
或 O_RDWR 标志 。 然 而 在 10.2 节 我 们 将 指出 ， 某 些 Unix 实 现 采 用 
O_RDWR， 因 为 只 要 使 用 一 个 信号 量 ， 都 涉及 读 写 该 信号 量 的 值 。 


2.5 小 结 


三 种 类 型 的 Posix IPC 一 一 消息 队列 、 信 号 量 、 共 享 内 存 区 一 一 都 
是 用 路 径 名 标识 的 。 但 是 这 些 路 径 名 既 可 以 是 文件 系统 中 的 实际 路 径 
名 ， 也 可 以 不 是 ， 而 这 点 不 一 致 性 会 导致 一 个 移植 性 问题 。 全 书 采 用 
的 解决 办 法 是 使 用 我 们 自己 的 px_ipc_name 范 数 。 

当 创 建 或 打开 一 个 IPC 对 象 时 ， 我 们 指定 一 组 类 似 于 open 函 数 所 用 
的 标志 。 创 建 一 个 新 的 PC 对 象 时 ， 我 们 必须 给 这 个 新 对 象 指 定 访问 权 
限 ， 所 用 的 是 同样 由 open 函 数 使 用 的 S_xxx 常 值 ( 见 图 2-4) 。 当 打开 一 
个 已 存在 的 IPC 对 象 时 ， 所 执行 的 权限 测试 与 打开 一 个 已 存在 的 文件 时 
AT 


习题 


2.1 使 用 Posix IPC 的 程序 ， 其 SUID 与 SGID 位 (APUE 的 4.4 节 ) 是 
如 何 影响 2.4 节 中 所 述 的 权限 测试 的 ? 

2.2 当 一 个 程序 打开 一 个 Posix IPC 对 象 时 ， 它 怎样 才能 判定 是 创建 
了 一 个 新 对 象 还 是 在 引用 一 个 已 有 的 对 象 ? 


第 3 章 System V IPC 


3.1 概述 


以 下 三 种 类 型 的 IPC 合 称 为 System V IPC: 
System V 消 息 队 列 〈 第 6 章 ) ; 
System V 信 号 量 (第 11 章 ) ; 
V 共 享 内 存 区 〈 第 14 章 ) o 
这 个 称谓 作为 这 三 种 IPC 机 制 的 通称 是 因为 它们 源 目 System V 
Unix ° System V IPC 在 访问 它们 的 函数 和 内 核 为 它们 维护 的 信息 上 享有 
许多 类 似 点 。 本 章 讲述 所 有 这 些 共同 属性 。 


图 3-1 汇 总 了 所 有 System V IPCENZA ° 


xxm 
eircom 


控制 PC 操作 的 函数 
IPC 操 作 函 数 msgsnd semop shmat 
msgrcv shmdt 

图 3-1 System V IPCEN SQLS 


System V IPCERZRBS YT SIF Ae AME LL FREI © [Rochkind 1985] 
提供 了 下 述 信 息 : System V 消 息 队 列 、 信 号 量 和 共享 内 存 区 是 20 世 纪 
70 年 代 后 期 在 俄 辫 俄 州 可 伦 布 市 的 一 个 贝尔 实验 室 分 文 机 构 开 发 的 ， 
他 们 开发 了 一 个 内 部 Unix 版 本 ， ( 顺 理 成 革 地) 称 为 “Columbus Unix” 
或 简称 “CB Unix” ° CB Unix 用 于 “操作 支持 系统 ” (Operation Support 
System) ， 即 自动 完成 电话 公司 的 管理 和 记录 保存 工作 的 事务 处 理 系 
统 。System V IPC X7 T 19834£ B&System V 加 入 到 商用 Unix 系 统 中 。 


3.2 key_t 键 和 ftok 辑 数 


图 1-4 中 注 明 ， 三 种 类 型 的 System V IPC 使 用 key_t 值 作为 它们 的 名 
字 。 头 文件 <sys/types.h> 把 key_t 这 个 数据 类 型 定义 为 一 个 整数 ， 它 通 稼 


是 一 个 至 少 32 位 的 整数 。 这 些 整数 值 通常 是 由 ftok 琅 数 赋予 的 。 

函数 ftok 把 一 个 已 存在 的 路 径 名 和 一 个 整数 标识 符 转 换 成 一 个 key_f 
值 ， 称 为 IPC 键 。 

#include <sys/ipc.h> 

key_t ftok(const char *pathname, int id); 

返回 : 若 成 功 则 为 IPC 键 ， 若 出 错 则 为 -1 

该 函数 把 从 pathname 导 出 的 信息 与 id 的 低 序 8 位 组 合成 一 个 整数 IPC 
BE o 

该 函数 假定 对 于 使 用 System V IPC 的 某 个 给 定 应 用 来 说 ， 客 户 和 服 
务 器 同意 使 用 对 该 应 用 有 一 定 意义 的 pathname。 它 可 以 是 服务 器 守护 
程序 的 路 径 名 、 服 务 器 使 用 的 某 个 公共 数据 文件 的 路 径 名 或 者 系统 
的 某 个 其 他 路 径 名 。 如 有 果 客 户 和 服务 器 之 间 只 需 单个 IPC 通 道 ， 那 么 可 
以 使 用 壁 如 说 值 为 1 的 id。 如 果 需 要 多 个 IPC 通 道 ， 壁 如 说 从 客户 到 服务 
妖 一 个 通道 ， 从 服务 右 到 客户 又 一 个 通道 ， 那 么 作为 一 个 例子 ,一 个 
通道 可 使 用 信 为 1 的 id， 另 一 个 通道 可 使 用 值 为 2 的 id。 和 客户 和 服务 器 一 
旦 在 pathname 和 id 上 达成 一 致 ， 双 方丈 都 能 调用 ftok 函 数 把 pathname 和 
id 转换 成 同一 个 IPC 键 。 
ftok 的 典型 实现 调用 stat 函 数 ， 然 后 组 合 以 下 三 个 值 。 
(1)pathname 所 在 的 文件 系统 的 信息 (stat 结 构 的 st_dev 成 员 ) 。 
(2) 该 文件 在 本 文件 系统 内 的 索引 市 点 号 (stat 结 构 的 st_ino 成 


) 


0 


(3)id 的 低 序 8 位 〈 不 能 为 0) ° [5] 

这 三 个 值 的 组 合 通常 会 产生 一 个 32 位 键 。 不 能 保证 两 个 不 同 的 路 
径 名 与 同一 个 id 的 组 合 产生 不 同 的 键 ， 因 为 上 面 所 列 三 个 条 目 (文件 系 
统 标识 符 、 索 引 节 点 、id) 中 的 信息 位 数 可 能 大 于 一 个 整数 的 信息 位 数 

(见习 题 3.5) 。 


索引 节点 绝 不 会 是 0]， 因 此 大 多 数 实现 把 IPC_PRIVATE (3.47 
讲述 ) 定义 为 0。 

如 果 pathname 不 存在 ,或 者 对 于 调用 进程 不 可 访问 ，ftok 就 返回 
-1。 注意 ， 路 径 名 用 于 产生 键 的 文件 不 能 是 在 服务 器 存活 期 间 由 服务 
器 反复 创建 并 删除 的 文件 ， 因 为 该 文件 每 次 创建 时 由 系统 赋予 的 索引 
节点 号 很 可 能 不 一 样 ， 于 是 对 下 一 个 调用 者 来 说 ， 由 ftok 返 回 的 键 也 可 
能 


图 3-2 中 的 程序 取 一 个 作为 命令 行 参 数 的 路 径 名 ， 调 用 stat， 调 用 
ftok， 然 后 输出 stat 结 构 的 st_dev 和 st_ino 成 员 以 及 得 出 的 IPC 键 。 这 三 个 
值 是 以 十 六 进 制 输出 的 ， 这 样 我 们 可 从 这 两 个 值 以 及 id 值 0x57 很 容易 地 
看 出 了 PC 键 是 如 何 构造 的 。 


svipc/ftok.c 
1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
4 1 
5 struct stat stat; 
6 if (argc != 2) 
7 err quit("usage: ftok <pathname>") ; 
8 Stat (argv[1], &stat) ; 
9 printf ("st_dev: $1x, st ino: ‘Slx, key: %x\n", 
10 (u long) stat.st dev, (u long) stat.st ino, 
11 Ftok(argv[1], 0x57)); 
12 exit (0); 
13 ) 
svipc/fiok.c 


图 3-2 获取 并 输出 文件 系统 信息 和 IPC 键 
在 Solaris 2.6 下 执行 该 程序 的 结果 如 下 : 

solaris % ftok /etc/system 

st_dev: 800018,st_ino: 4alb,key: 57018alb 
solaris 96 ftok /usr/tmp 

st dev: 800015,st ino: 10b78,key: 57015b78 


solaris 96 ftok /home/rstevens/Mail.out 


st_dev: 80001f,st_ino: 3b03,key: 5701fb03 

很 明显 ，id 在 IPC 键 的 高 序 8 位 ，st_dev 的 低 序 12 位 IPC 在 键 的 接 下 
来 12 位 ，st_ino 的 低 序 12 位 则 在 IPC 键 的 低 序 12 位 。 

我 们 展示 本 例子 的 目的 不 是 让 大 家 依据 这 种 信息 组 合 方式 构造 出 
IPC 键 ， 而 十 让 大 家 看 看 一 个 实现 是 如 何 组 合 pathname 和 id 的 。 其 他 实 
现 可 能 以 不 同 的 方式 组 合 。 

FreeBSD 使 用 id 的 低 8 位 、st_dev 的 低 8 位 以 及 st_ino 的 低 16 位 。 

注意 由 ftok 完 成 的 映射 是 单 向 的 ， 因 为 st_dev 和 st_ino 中 某 些 位 未 被 
使 用 。 这 就 是 说 ， 我 们 不 能 从 一 个 给 定 的 键 确定 创建 它 时 所 用 的 路 径 
名 o 


3.3 ipc_perm 结 构 


内 核 给 每 个 IPC 对 象 维 护 一 个 信息 结构 ， 其 内 容 跟 内 核 给 文件 维护 
的 信息 类 似 。 


struct ipc_perm { 


uid t uid; /* owner's user id */ 
gid t gid; /* owner's group id */ 
uid t cuid; /* creator's user id */ 


gid t cgid; /* creator's group id */ 


mode_t mode; /* read-write permissions */ 
ulong t seq; /* slot usage sequence number */ 
key t key; /* [PC key */ 


}; 
该 结构 以 及 System V IPC E ZA fi Fd AY Be HH T RJ à [ELE EE 
<Ssys/ipc.h> 头 文件 中 。 我 们 将 在 本 章 讨论 该 结构 的 所 有 成 员 。 


3.4 创建 与 打开 IPC 通 道 


创建 或 打开 一 个 IPC 对 象 的 三 个 getXXX 画 数 〈 见 图 3-1) 的 第 一 个 
参数 key 是 类 型 为 key_t 的 IPC 键 ， 返 回 值 identifier 是 一 个 整数 标识 符 。 
该 标识 符 不 同 于 ftok 函 数 的 id 参 数 ， 我 们 不 久 就 会 看 到 。 对 于 key 值 ， 应 
用 程序 有 两 种 选择 。 

(调用 ftok， 给 它 传递 pathname 和 id。 

(2) 指 定 key 为 IPC_PRIVATE， 这 将 保证 会 创建 一 个 新 的 、 唯 一 的 
IPC 对 象 。 

图 3-3 展 示 有 关 步 又 的 顺序 。 


* pathname 


int id 


msgcgl () , msgsnd () , msgrcv () 
semct1(),semop() 
shmct1(),shmat () , shmdt () 


int identifier 


key NIPC_PREVATE 


1T Mie 建 访问 IPC 通 道 
IPC 通 道 


图 3-3 从 IPC 键 生成 IPC 标 识 符 


所 有 三 个 getXXX 画 数 ( 见 图 3-1) 都 有 一 个 名 为 oflag 的 参数 ， 它 指 
定 IPC 对 象 的 读 写 权 限 位 (ipc_perm 结 构 的 mode 成 员 ) ， 并 选择 是 创建 
一 个 新 的 IPC 对 象 还 是 访问 一 个 已 存在 的 IPC 对 象 。 这 种 选择 的 规则 如 
下 o 

指定 key 为 IPC_PRIVATE 能 保证 创建 一 个 唯一 的 IPC 对 象 。 没 有 一 
对 id 和 pathname 的 组 合 会 导致 ftok 产 生 IPC_PRIVATE 这 个 键 值 。 

设置 oflag 参 数 的 IPC_CREAT 位 但 不 设置 它 的 IPC_EXCL 位 时 ， 如 
果 所 指定 键 的 IPC 对 象 不 存在 ， 那 就 创建 一 个 新 的 对 象 ， 否 则 返回 该 对 
Fe o 

同时 设置 oflag 的 IPC_CREAT 和 IPC_EXCL 位 时 ， 如 果 所 指定 键 的 
IPC 对 象 不 存在 ， 那 就 创建 一 个 新 的 对 象 ， 否 则 返回 一 个 EEXIST 错 
误 ， 因 为 该 对 象 已 存在 。 


对 IPC 对 和 象 来 说 ，IPC_CREAT 和 IPC_EXCL 的 组 合 跟 open 函 数 的 
O_CREAT 和 O_EXCL 的 组 合 类 似 。 

设置 IPC_EXCL 位 但 不 设置 IPC_CREAT 位 是 没有 意义 的 。 

图 3-4 展 示 了 打开 一 个 IPC 对 象 的 逻辑 流程 。 图 3-5 是 展示 图 3-4 所 示 
逻辑 的 另 一 种 形式 。 


成 功 ， 创 建 了 新 对 象 ， 


起 始 位 置 返回 标识 符 


key==IPC PRIVATE? | 


key 已 经 存在 ? 


出 错 返 回 ， 
errno = ENOSPC 


新 对 象 被 创建 


fi 


出 错 返回 ， 
errno = ENOENT 


IPC CREATED J? 


出 错 返回 ， 
errno = EEXIST 


已 存在 对 象 被 引用 


出 错 返回 ， 
errno = EACCES 


成 功 ， 返 回 标识 符 


图 3-4 创建 或 打开 一 个 IPC 对 象 的 逻辑 


oflag Hk key et 


无 特殊 标志 出 错 ，errno = ENOENT 成 功 ， 引 用 已 存在 对 象 


IPC CREAT 成 功 ， 创 建新 对 象 成 功 ， 引 用 已 存在 对 象 
IPC CREAT | IPC EXCL 成 功 ， 创 建新 对 象 IH, errno = EEXIST 


图 3-5 OERI F — ^ IPCOBGÉ Hes 

注意 图 3-5 中 间 只 有 IPC_CREAT 而 没有 IPC_EXCL 标 志 的 那 一 行 ， 
我 们 得 不 到 一 个 指示 以 判别 是 创建 了 一 个 新 对 象 ， 还 是 在 引用 一 个 已 
存在 的 对 象 。 大 多 数 应 用 程序 中 ， 由 服务 器 创建 IPC 对 象 并 指定 


IPC_CREAT 标 志 (如 果 它 不 关心 该 对 象 是 否 存 在 ) 或 IPC_CREAT | 
IPC_EXCL 标 志 (如 果 它 需要 检查 该 对 象 是 否 已 经 存在 ) 。 客 户 则 不 指 
定 其 中 任何 一 个 标志 (它们 假定 服务 器 已 经 创建 了 该 对 象 ) 。 

System V IPC 定 义 了 自己 的 IPC_xxx 常 值 ， 而 不 像 标准 open 函 数 以 
及 Posix IPC 画 数 那 样 使 用 O_CREAT 和 O_EXCL 常 值 (参见 图 2-3) e 

还 要 注意 的 是 ，System V IPC 函 数 把 它们 的 IPC_xxx 常 值 跟 权 限 位 

(将 在 下 一 节 讲 述 ) 组 合 到 单个 oflag 参 数 中 。open 函 数 以 及 Posix IPC 

函数 有 一 个 名 为 oflag 的 参数 ， 用 以 指定 各 种 O_xxx 标 志 ， 另 有 一 个 名 为 
mode 的 参数 ， 用 以 指定 权限 位 。 


3.5 IPC 权 限 


每 当 使 用 某 个 getXXX 了 画 数 (指定 IPC_CREAT 标 志 ) 创建 一 个 新 的 
IPC 对 象 时 ， 以 下 信息 就 保存 到 该 对 象 的 ipc_perm 结 构 中 (3.3 节 ) ° 

(1)oflag 参 数 中 某 些 位 初始 化 ipc_perm 结 构 的 mode 成 员 。 图 3-6 展 示 
了 System V 三 种 不 同 IPC 机 制 的 权限 位 (记号 >>3 的 意思 是 将 值 右 移 3 


BE s 


数字 值 
(八进制 ) 
由 用 户 〈 属 主 ) 写 


HH ( 属 ) 组 成 员 读 
由 ( 属 ) 组 成 员 写 


SEM R >> 6 由 其 他 用 户 读 


MSG W >> 6 SEM A>> 6 由 其 他 用 户 写 


图 3-6 IPC 读 写 权限 的 mode 值 


(2)cuid 和 cgid 成 员 分 别 设置 为 调用 进程 的 有 效用 户 ID 和 有 将 组 ID © 
这 两 个 成 员 合 称 为 创建 者 ID (creatorID) 。 


(3)ipc_perm 结 构 的 uid 和 gid 成 员 也 分 别 设 置 为 调用 进程 的 有 效用 户 
ID 和 有 效 组 ID。 这 两 个 成 员 合 称 为 属 主 ID (ownerID) 。 

尽管 一 个 进程 可 通过 调用 相应 IPC 机 制 clXXX 丙 数 (所 用 命令 为 
IPC SET) 修改 属 主 ID， 创 建 者 ID 却 从 不 改变 。 这 三 个 ctIXXX 画 数 还 
允许 一 个 进程 修改 某 个 IPC 对 象 的 mode 成 员 。 

多 数 实现 在 <sys/msg.h>、<sys/sem.h> 和 <sys/shm.h> 这 三 个 头 文件 
中 定义 图 3-6 中 所 示 的 6 个 常 值 : MSG R ^ MSGW ^ SEMR ^ 
SEM_A、SHM_R、SHM_W。 不 过 Unix 98 没 有 这 样 的 要 求 。SEM_A 中 
的 后 级 A 代表 “alter”( 改 变 ) 。 

这 三 个 clXXX 函 数 不 使 用 通常 的 文件 模式 创建 掩 码 。 消 息 队 列 、 
信号 量 或 共享 内 存 区 对 象 的 权限 准确 地 设置 成 由 这 些 画 数 所 指定 的 
值 。 

Posix IPC 并 不 允许 一 个 IPC 对 象 的 创建 者 改变 该 对 象 的 属 主 。Posix 
IPC 中 没有 类 似 于 IPC_SET 命 令 的 操作 。 然 而 如 有 果 Posix IPC 名 字 存 储 在 
文件 系统 中 ， 那 么 超级 用 户 可 使 用 chown 命 令 改 变 其 属 主 。 

每 当 有 一 个 进程 访问 某 个 IPC 对 象 时 ，IPC 就 执行 两 级 检查 ， 该 IPC 
对 象 被 打开 时 〈getXXX 函 数 ) 执行 一 次 ， 以 后 每 次 使 用 该 对 象 时 执行 
一 次 o 
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象 的 通道 时 ，IPC 就 执行 一 次 初始 检查 ， 验 证 调用 者 的 oflag 参 数 没 有 指 
定 不 在 该 对 象 ipc_perm 结 构 mode 成 员 中 的 任何 访问 位 。 这 就 是 图 3-4 中 
底部 的 方 框 。 举 例 来 说 ， 一 个 服务 器 进程 可 以 把 它 的 输入 消息 队列 的 
mode 成 员 设置 成 关 掉 组 成 员 读 和 其 他 用 户 读 这 两 个 权限 位 。 任 何 进程 
调用 针对 该 消息 队列 的 msgget 函 数 时 ， 如 果 所 指定 的 oflag 参 数 包 含 这 
两 位 ， 那 么 该 钞 数 都 将 返回 一 个 错误 。 然 而 由 getXXX 画 数 完成 的 这 种 
测试 并 没有 多 大 用 处 。 它 隐 含 假定 调用 者 知道 自己 属于 哪个 权限 范畴 
一 一 用 户 、 组 成 员 或 其 他 用 户 。 如 果 创 建 者 特意 关 掉 了 某 些 权限 位 ， 


而 调用 者 却 指定 了 这 些 位 ， 那 么 getXXX 函 数 将 检测 出 这 个 错误 。 然 而 
任何 进程 都 能 够 完全 绕 过 这 种 检查 ， 其 办 法 是 在 得 知 该 IPC 对 和 象 已 存在 
后 ， 简 单 地 指定 一 个 值 为 0 的 oflag 参 数 即 可 。 

(2) 每 次 IPC 操 作 都 对 使 用 该 操作 的 进程 执行 一 次 权限 测试 。 举 例 来 
说 ， 每 当 有 一 个 进程 试图 使 用 msgsnd 函 数 往 某 个 消息 队列 放置 一 个 消 
息 时 ，msgsnd 函 数 将 以 下 面 所 列 的 顺序 执行 (E) 测试 。 一 旦 某 个 
测试 赋予 了 访问 权 ， 其 后 的 测试 就 不 再 执行 。 

a) 超 级 用 户 总 是 赋予 访问 权 。 

b) 如 果 当 前 进程 的 有 效用 户 ID 等 于 该 IPC 对 象 的 uid 值 或 cuid 值 ， 而 
且 相 应 的 访问 位 在 该 PC 对象 的 mode 成 员 中 是 打开 的 ， 那 么 赋予 访问 
权 。 这 儿 “ 相 应 的 访问 位 * 的 意思 是 ， 如 有 果 调 用 者 想 要 在 该 IPC 对 象 上 执 
行 一 个 读 操 作 (例如 从 某 个 消息 队列 接收 一 个 消息 ) ， 那 么 读 位 必须 
设置 ， 如 果 想 要 执行 一 个 写 操作 ， 那 么 写 位 必须 设置 。 

co 如果 当 前 进程 的 有 效 组 ID 等 于 该 ITPC 对 象 的 gid 值 或 cgid 值 ， 而 且 
相应 的 访问 位 在 该 IPC 对 象 的 node 成 员 中 是 打开 的 ， 那 么 赋予 访问 权 。 

d) 如 果 上 面 的 测试 没有 一 个 为 真 ， 那 么 相应 的 “其 他 用 户 * 访 问 位 在 
该 PC 对象 的 mode 成 员 中 必须 是 打开 的 才能 赋予 访问 权 。 


3.6 标识 符 重 用 


ipc_perm 结 构 (3.3585) 还 含有 一 个 名 为 seq 的 变量 ， 它 是 一 个 槽 位 
使 用 情况 序列 号 。 该 变量 是 一 个 由 内 核 为 系统 中 每 个 潜在 的 IPC 对 象 维 
护 的 计数 絮 。 每 当 删 除 一 个 IPC 对 象 时 ， 内 核 束 递增 相应 的 槽 位 号 ， 奉 
次 出 则 循环 回 0。 

我 们 在 本 和 讲述 的 是 普通 SVR4 实 现 。Unix 98 没 有 强制 使 用 该 实现 
技巧 。 


该 计数 器 的 存在 有 两 个 原因 。 首 先 ， 考 虑 由 内 核 维 护 的 用 于 打开 
文件 的 文件 描述 符 。 它 们 是 些小 整数 ， 只 在 单个 进程 内 有 意义 ， 也 就 
是 它们 是 进程 特定 的 值 。 如 果 我 们 试图 从 譬如 说 文件 描述 符 4 读 ， 那 么 
这 种 尝试 只 有 该 进程 已 在 该 描述 符 上 打开 了 一 个 文件 后 才 会 奏效 。 它 
对 于 可 能 在 另外 一 个 与 本 进程 无 亲缘 关系 的 进程 中 打开 在 文件 描述 符 4 
上 的 文件 来 说 ， 根 本 没有 意义 。 然 而 ，System V IPC 标 识 符 却 是 系统 苞 
围 的 ， 而 不 是 特定 于 进程 的 。 

我 们 从 某 个 get 函 数 (msgget、semget 和 shmget) 获得 一 个 IPC 标 识 
符 (类 似 于 文件 描述 符 ) 。 这 些 标识 符 也 是 整数 ， 不 过 它们 的 意义 适 
用 于 所 有 进程 。 举 例 来 说 ， 如 果 有 两 个 无 亲缘 关系 的 进程 (一 个 是 客 
户 ， 一 个 是 服务 器 ) 使 用 单个 消息 队列 ， 那 么 由 msgget 函 数 返回 的 该 
消息 队列 的 标识 符 在 双方 进程 中 必须 是 同一 个 整数 值 ， 这 样 双 方才 能 
访问 同一 个 消息 队列 。 这 种 特性 意味 着 某 个 行为 不 端的 进程 可 能 尝试 
从 另外 某 个 应 用 的 消息 队列 中 读 消 息 ， 办 法 是 尝试 不 同 的 小 整数 标识 
符 ， 以 期 待 找 出 一 个 当前 在 使 用 的 允许 大 家 读 访 问 的 消息 队列 。 要 是 
这 些 标识 符 的 取 值 是 小 整数 〈 像 文件 描述 符 那 样 ) ， 那 么 找到 一 个 有 
效 标识 符 的 可 能 性 约 为 1:50 (假设 每 个 进程 最 多 有 约 50 个 描述 符 ) 。 

为 避免 这 样 的 问题 ， 这 些 IPC 机 制 的 设计 者 们 把 标识 符 值 的 可 能 范 
围 扩 大 到 包含 所 有 整数 ， 而 不 是 仅仅 包含 小 整数 。 这 种 扩大 是 这 么 实 
现 的 : 每 次 重用 一 个 IPC 表 项 时 ， 把 返回 给 调用 进程 的 标识 符 值 增加 一 
个 IPC 表 项 数 。 举 例 来 说 ， 如 果 系 统 配置 成 最 多 50 个 消息 队列 ， 那 么 内 
核 中 的 第 一 个 消息 队列 表 项 首次 被 使 用 时 ， 返 回 给 进程 的 标识 符 值 为 
0。 该 消息 队列 被 删除 ， 从 而 第 一 个 表 项 得 以 重用 后 ， 所 返回 的 标识 符 
为 50。 再 下 一 次 重用 时 ， 该 标识 符 变 为 100， 如 此 等 等 。 既 然 sq 变量 通 
常 作 为 一 个 无 符号 长 整数 实现 〈 见 3.3 节 所 示 的 ipc_perm 结 构 ) ， 那 么 
该 表 项 只 有 在 被 重用 85 899 346 (232 /150， 假 设 长 整数 为 32 位 ) 次 后 才 
循环 回 0。 
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System V IPC 标 识 待 。 这 有 助 于 确保 过 早 终止 的 服务 器 重新 启动 后 不 会 
重用 标识 符 。 

作为 这 种 特性 的 一 个 例子 ， 图 3-7 中 的 程序 输出 由 msgget 返 回 的 前 
10 个 标识 符 值 。 


svmsg/slot.c 
1 #include "ünpipo.h" 

2 int 

3 main(int argc, char **argv) 


5 int i, msqid; 

6 for (i = 0; i« 10; i++) { 

7 msqid = Msgget (IPC_PRIVATE, SVMSG_MODE | IPC_CREAT) ; 
8 printf ("msqid = %d\n", msqid) ; 

9 Msgctl(msqid, IPC RMID, NULL); 

10 

11 exit(0); 

12 3 


svmsg/slot.c 


图 3-7 连续 输出 由 内 核 赋 予 的 消息 队列 标识 符 10 次 

每 次 循环 由 msgget 创 建 一 个 消息 队列 ， 然 后 由 使 用 IPC_RMID 命 令 
的 msgctl 删 除 该 队列 。 常 值 SYVMSG_MODE 定 义 在 我 们 的 unpipc.h 头 文 
件 中 (AIC-1) ， 它 给 我 们 的 System V 消 息 队 列 指定 默认 权限 位 。 该 程 
序 的 输出 如 下 : 


solaris % slot 


msqid = 0 
msqid = 50 
msqid = 100 
msqid = 150 
msqid = 200 
msqid = 250 
msqid = 300 


msqid = 350 


msqid = 400 

msqid = 450 

如 果 再 次 运行 该 程序 ， 我 们 就 能 看 出 槽 位 使 用 情况 序列 号 是 一 个 

跨 进程 保持 的 内 核 变 量 。 

solaris 96 slot 

msqid = 500 

msqid = 550 

msqid = 600 

msqid = 650 

msqid = 700 

msqid = 750 

msqid = 800 

msqid = 850 

msqid = 900 

msqid = 950 


3.7 ipcs 和 icrm 程 序 


由 于 System V IPC 的 三 种 类 型 不 是 以 文件 系统 中 的 路 径 名 标识 的 ， 
因此 使 用 标准 的 ls 和 rm 程序 无 法 看 到 它们 ， 也 无 法 删除 它们 。 不 过 实现 
了 这 些 类 型 IPC 的 任何 系统 都 提供 两 个 特殊 的 程序 : ipcs 和 ipcrm 。 ipcs 
输出 有 天 System V IPC 特 性 的 各 种 信息 ，ipcrm 则 删除 一 个 System VIF 
息 队 列 、 信 和 号 量 集 或 共 吾 内 存 区 。 前 者 文 持 约 十 来 个 命令 行 选项 ， 它 
们 决定 报告 哪 种 类 型 的 IPC 以 及 输出 哪些 信息 ， 后 者 文 持 6 个 命令 行 选 
项 。 所 有 这 些 选 项 的 详细 信息 可 得 阅 它 们 的 手册 页 面 。 

System V IPC 不 是 Posix 中 的 内 容 ， 因 此 这 两 个 命令 也 未 被 Posix.2 
标准 化 。 不 过 它们 是 Unix 98 的 内 容 。 


3.8 内 核 限 制 


System V IPC 的 多 数 实现 有 内 在 的 内 核 限 制 ， 例 如 消 恩 队列 的 最 大 
数目 、 每 个 信和 号 量 集 的 最 大 信号 量 数 ， 等 等 。 我 们 将 在 图 6-25、 图 11-8 
和 图 14-5 中 给 出 这 些 限制 的 某 些 典型 值 。 这 些 限 制 通常 起 源 于 最 初 的 
System V 实 现 。 

[Bach 1986] 的 11.2 节 和 [Goodheart and Cox 1994| 的 第 8 章 都 讲 
述 了 消息 队列 、 信 号 量 和 共享 内 存 区 的 实现 。 某 些 限制 就 在 那儿 说 
明 o 

不 焉 的 是 ， 这 些 对 象 的 大 小 被 内 核 限 制 得 往往 太 小 ， 这 是 因为 其 
中 许多 限制 起 源 于 在 某 个 小 地 址 空间 系统 (16 位 PDP-11) 上 完成 的 最 
初 实现 。 然 而 万 对 的 是 ， 多 数 系统 允许 管理 员 部 分 或 完全 修改 这 些 默 
认 限 制 ， 但 是 不 同 风 格 的 Unix 所 需 的 步骤 也 不 一 样 。 多 数 系统 要 求 在 
修改 完 值 后 重新 自 举 运 行 中 的 内 核 。 尽 管 如 此 ， 某 些 实现 仍然 给 其 中 
一 些 限 制 使 用 16 位 整数 ， 这 在 无 形 之 中 提供 了 一 个 难以 突破 的 便 限 
制 。 

举例 来 说 ，Solaris 2.6 有 20 个 这 些 限 制 。 它 们 的 当前 值 可 使 用 sysdef 
命令 输出 ， 不 过 如 果 相 应 的 内 核 模 块 尚未 加 载 (也 就 是 说 尚未 使 用 IPC 
机 制 ) ， 那 么 所 输出 的 值 为 0。 它们 的 值 可 通过 在 /etc/system 文 件 中 加 
入 如 下 语句 来 修改 ， 而 /etc/system 是 目 举 内 核 时 读 入 的 。 


set msgsys:msginfo msgseg = value 


set msgsys:msginfo msgssz - value 
set msgsys:msginfo msgtql = value 
set msgsys:msginfo msgmap - value 
set msgsys:msginfo msgmax - value 
set msgsys:msginfo msgmnb - value 


set msgsys:msginfo msgmni - value 


set semsys:seminfo semopm = value 
set semsys:seminfo semume - value 
set semsys:seminfo semaem - value 
set semsys:seminfo semmap - value 
set semsys:seminfo semvmx - value 
set semsys:seminfo semmsl = value 

set semsys:seminfo semmni - value 

set semsys:seminfo semmns - value 
set semsys:seminfo semmnu - value 
set shmsys:shminfo shmmin - value 
set shmsys:shminfo shmseg - value 

set shmsys:shminfo shmmax - value 


set shmsys:shminfo shmmni - value 
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量 名 。 


po c Unix 4.0B, ，sysconfig 程 序 可 用 于 查询 或 修改 许多 内 核 


参数 和 限制 。 下 面 是 使 用 -gq 选项 时 该 程序 的 输出 ， 它 就 ipc 子 系统 查询 


以 输出 当前 限制 值 。 我 们 已 省 略 挥 了 与 System V IPC 机 制 无 关 的 一 


alpha 96 /sbin/sysconfig -q ipc 
ipc: 

msg-max - 8192 

msg-mnb - 16384 

msg-mni = 64 

msg-tql = 40 

shm-max = 4194304 


shm-min = 1 


shm-mni = 128 

shm-seg = 32 

sem-mni = 16 

sem-msl = 25 

sem-opm - 10 

sem-ume - 10 

sem-vmx = 32767 

sem-aem = 16384 

num-of-sems - 60 

这 些 参数 的 默认 值 可 通过 在 /etcsysconfigtab 文 件 中 指定 不 同 的 值 来 
修改 ， 不 过 该 文件 应 使 用 sysconfigdb 程 序 维护 。 该 文件 是 在 系统 自 举 时 
读 入 的 。 


3.9 小 结 


msgget、semget 和 shmget 这 三 个 函数 的 第 一 个 参数 是 一 个 System V 
IPC 键 。 这 些 键 通常 是 使 用 系统 的 ftok 画 数 从 某 个 路 径 名 创建 出 的 。 键 
还 可 以 是 IPC_PRIVATE 这 个 特殊 值 。 这 三 个 函数 创建 一 个 新 的 IPC 对 象 
或 打开 一 个 已 存在 的 IPC 对 象 ， 并 返回 一 个 System V IPC 标 识 符 : 接 下 
去 用 于 给 其 余 IPC 画 数 标识 该 对 象 的 一 个 整数 。 这 些 整 数 不 是 特定 于 进 
程 的 标识 符 〈 像 描述 符 那样 ) ， 而 是 系统 范围 的 标识 符 。 这 些 标识 符 
还 由 内 核 在 一 段 时 间 后 重用 。 

与 每 个 System V IPC 对 象 相 关联 的 是 一 个 ipc_perm 结 构 ， 它 含有 诸 
如 属 主 的 用 户 ID、 组 ID、 读 写 权 限 等 信息 。Posix IPC 和 System V IPC 的 
差别 之 一 是 ， 这 些 信 息 对 于 System V IPC 对 象 总 是 可 用 的 (通过 以 
IPC_STAT 命 令 参 数 调用 三 个 ctlXXX 函 数 中 的 某 一 个 ) ， 但 是 对 于 Posix 
IPC 对 象 来 说 ， 能 否 访 问 这 些 信 息 要 看 具体 实现 。 如 果 Posix IPC 对 象 存 


放 在 文件 系统 中 ， 而 且 我 们 知道 它们 在 文件 系统 中 的 名 字 ， 那 么 使 用 
现 有 的 文件 系统 工具 就 能 访问 到 与 ipc_perm 结 构 的 内 容 相 同 的 信息 。 

在 创建 一 个 新 的 System V IPC 对 象 或 打开 一 个 已 存在 的 对 象 时 ， 可 
给 getXXX 函 数 指定 两 个 标志 (IPC_CREAT 和 IPC_EXCL) ， 外 加 9 个 权 
限 位 。 

ZAE], (EH System V IPC 的 最 大 问题 在 于 多 数 实 现在 这 些 对 象 
的 大 小 上 施加 了 人 为 的 内 核 限制 ， 这 些 限 制 可 追溯 到 它们 历史 上 的 最 
初 实 现 。 这 就 是 说 ， 较 多 使 用 System V IPC 的 多 数 应 用 需要 系统 管理 员 
修改 这 些 内 核 限 制 ， 然 而 不 同 风格 的 Unix 完 成 这 些 修改 工作 的 步骤 也 
不 一 样 。 


习题 


3.1 粗 读 一 下 6.5 节 的 msgctl 范 数 ， 把 图 3-7 中 的 程序 修改 成 除 输 出 所 
赋予 的 标识 符 外 ， 还 输出 ipc_perm 结 构 的 seq 成 员 。 

3.2 运行 图 3-7 中 的 程序 两 次 后 立即 运行 一 个 创建 两 个 消息 队列 的 程 
序 。 假 设 内 核 从 自 举 以 来 没有 任何 其 他 应 用 程序 使 用 过 其 他 消息 队 
列 ， 那 么 由 内 核 返 回 的 作为 消息 队列 标识 符 的 两 个 值 是 什么 ? 

3.3 我 们 在 3.5 节 中 指出 System V IPC getXXX 画 数 不 使 用 文件 模式 
创建 掩 码 。 编 写 一 个 测试 程序 ， 由 它 创 建 一 个 FIFO 《使 用 4.6 节 中 所 述 
的 mkfifo 函 数 ) 和 一 个 System VIA ELS, 28 EMRE TER Ab E666 

(八进制 ) 。 比 较 创 建成 的 FIFO 和 消息 队列 二 者 的 权限 。 在 运行 该 程 
序 前 ， 确 保 你 的 shell umask 为 非 零 值 。 

3.4 如 果 一 个 服务 器 想 要 为 其 客户 创建 一 个 唯一 的 消息 队列 ， 那 么 
采用 哪 种 方法 更 恰当 一 一 使 用 某 个 常 值 路 径 名 ( 壁 如 说 该 服务 器 的 可 
执行 文件 ) 作为 ftok 的 一 个 参数 呢 ， 还 是 使 用 IPC_PRIVATE? 


3.5 修改 图 3-2 使 其 只 输出 IPC 键 和 路 径 名 。 运 行 find 程 序 输出 你 的 
系统 上 的 所 有 路 径 名 ， 并 将 这 些 路 径 名 逐个 作为 刚 修改 过 的 程序 的 命 
令 行 参数 运行 之 。 有 多 少 路 径 名 映射 到 同一 键 值 上 ? 

3.6 如 果 你 的 系统 支持 sar 程 序 (“系统 行为 报告 程序 ”) ， 那 么 运行 
如 下 命令 : 

sar -m 5 6 

该 命令 输出 每 秒 钟 的 消息 队列 操作 数 和 信和 号 量 操 作 数 ， 采 样 频率 
为 5 秒 钟 一 次 ， 共 6 次 。 


[1]. 意思 是 用 新 的 出 错 处 理 函 数 代 替 原 来 的 err_sys， 这 样 对 线程 画 数 的 
调用 可 直接 作为 狐 的 出 错 处 理 函 数 中 增设 的 参数 用 ， 即 

eir sys new("pthread mutex lock 
error",pthread mutex lock(&ndone mutex)) ° — FÉ t 


[2]. snprinf 现 在 已 经 是 C99 标 准 的 函数 。 一 一 编者 注 


[3]. 此 处 为 APUE 第 1 版 英文 原版 书页 码 ， 第 2 版 为 第 97~100 页 ， 第 2 版 
中 文 版 为 第 80~82 页 。 编者 注 


[4]. 同样 为 第 1 版 英文 原版 书 中 页 码 ， 第 2 版 为 第 16~17 页 ， 第 2 版 中 文 
版 为 第 12~13 页 。 编者 注 


[5]. Unix 98 现 在 宣称 : 当 ftok 的 id 参数 的 低 序 8 位 为 0 时 ， 该 函数 的 行为 
是 未 指定 的 。 查 看 一 番 后 作者 发 现 Solaris 和 Digital Unix 中 关于 ftok 的 手 
册页 面 也 作 了 同样 的 声明 。 作 者 不 知道 这 是 什么 时 候 加 上 的 ， 而 且 作 
者 于 1991 年 编写 的 “System V Interface Definition” 中 也 没有 这 样 的 声 

明 。AIX 甚 至 走 得 更 远 ， 若 id 为 0 则 返回 一 个 错误 。 实 际 上 ftok 的 三 种 不 
同 实 现 一 System V Release 2 ` GNU libc 和 BSD/OS 一 一 没有 一 个 要 求 
id 为 非 零 : 它们 只 是 在 id 的 低 序 8 位 中 作 逻 辑 或 ， 而 不 管 它 的 值 。 


第 4 章 管道 和 FIFO 
4.1 概述 


管道 是 最 初 的 Unix IPC 形 式 ， 可 追溯 到 1973 年 的 Unix 第 3 版 | Salus 
1994] 。 尽 管 对 于 许多 操作 来 说 很 有 用 ， 但 它们 的 根本 局 限 在 于 没有 名 
字 ， 从 而 只 能 由 有 亲缘 关系 的 进程 使 用 。 这 一 点 随 FIFO 的 加 入 在 System III 
Unix (19824) 中 得 以 改正 。FIFO 有 时 称 为 有 名 管道 (named pipe) 。 管 
道 和 FIFO 都 是 使 用 通 销 的 read 和 write 函数 访问 的 。 

技术 上 讲 ， 自 从 可 以 在 进程 间 传 递 描述 符 〈 在 本 书 15.8 节 和 UNPvl 的 
14.7 节 中 讲述 ) 后 ， 管 道 也 能 用 于 无 亲缘 关系 的 进程 间 。 然 而 现实 中 ， 管 
道 通常 用 于 具有 共同 祖先 的 进程 间 。 

本 章 讲述 管道 和 FIFO 的 创建 与 使 用 。 我 们 使 用 一 个 简单 的 文件 服务 器 
例子 ， 同 时 查看 一 些 客户 -服务 器 程序 设计 问题 : IPC 通 道 需要 量 、 失 代 服 
务 器 与 并 发 服务 器 、 字 节 流 与 消息 接口 。 


4.2 一 个 简单 的 客户 -服务 器 例子 


图 4-1 所 示 的 客户 -服务 器 例子 在 本 章 和 第 6 章 中 都 要 用 到 ， 我 们 用 它 来 
分 析 说 明 管 道 、FIFO 和 System V 消 息 队 列 。 


标准 输入 路 径 名 


路 径 名 ------------ 
n i Jg 9 
文件 内 容 或 客 请 |。 文件 内 容 或 出 错 消息 ”| 服务 器 
三 


出 错 消息 标准 输出 


图 4-1 客户 -服务 器 例子 


图 中 客户 从 标准 输入 (stdin) 读 进 一 个 路 径 名 ， 并 把 它 写 入 IPC 通 
道 。 服 务 器 从 该 IPC 通 道 读 出 这 个 路 径 名 ， 并 壬 试 打开 其 文件 来 读 。 如 末 
服务 器 能 打开 该 文件 ， 它 就 读 出 其 中 的 内 容 ， 并 写 入 (可 能 男 一 个 ) IPC 
通道 ， 以 作为 对 客户 的 啊 应 ;否则 ， 它 惑 响应 以 一 个 出 错 消 息 。 客 户 随 后 
从 该 IPC 通 道 读 出 啊 应 ， 并 把 它 写 到 标准 输出 (stdout) 。 如 果 服 务 器 无 法 
读 该 文件 ， 那 么 客户 读 出 的 响应 将 是 一 个 出 错 消 恩 。 否 则 ， 客 户 读 出 的 啊 
应 就 是 该 文件 的 内 容 。 客 户 和 服务 闫 之 间 的 虚线 表示 IPC 通 道 。 


4.3 管道 


所 有 式样 的 Unix 都 提供 管道 。 它 由 pipe 函 数 创 建 ， 提 供 一 个 单 路 (HR 
向 ) 数据 流 。 

#include <unistd.h> 

int pipe(int fd[2]); 

返回 : ARAN AO, AEA- 

VALER SOR ISI MICHAL: fd[0] 和 fq[1]。 前 者 打开 来 读 ， 后 者 打开 
KE e 

有 些 版 本 的 Unix (例如 SVR4) 提供 全 双 工 管道 ， 也 就 是 说 这 些 管道 
的 两 端 都 是 既 可 用 于 读 ， 也 可 用 于 写 。 创 建 一 个 全 双 工 IPC 管 道 的 另 一 种 
方法 是 使 用 UNPvl 的 14.3 节 中 讲述 的 socketpair 函 数 ， 它 在 大 多 数 现行 Unix 
系统 上 都 能 工作 。 然 而 管道 的 最 常见 用 途 是 用 在 各 种 shell 中 ， 这 种 情况 下 
半 双 工 管道 足够 了 。 

Posix.1 和 Unix 98 只 要 求 半 双 工 管道 ， 本 章 中 我 们 也 这 么 假设 。 


宏 S_ISFIFO 可 用 于 确定 一 个 描述 符 或 文件 是 管道 还 是 FIFO。 它 的 唯一 
参数 是 stat 结 构 的 st_mode 成 员 ， 计 算 结 果 或 者 为 真 〈 非 零 值 ) ， 或 者 为 假 
(0) 。 对 于 管道 来 说 ， 这 个 stat 结 构 是 由 fstat 芳 数 填写 的 。 对 于 FIFO 来 
说 ， 这 个 结构 是 由 fstat 、jlstat 或 stat 函 数 填 写 的 。 


图 4-2 展 示 了 单个 进程 中 管道 的 模样 。 


进程 


fd[0] 


fa[1] 


一 数据 流 一 


图 4-2 单个 进程 中 的 管道 
尽管 管道 是 由 单个 进程 创建 的 ， 它 却 很 少 在 单个 进程 内 使 用 (我 们 将 
在 图 5-14 中 给 出 在 单个 进程 内 使 用 管道 的 一 个 例子 ) 。 管 道 的 典型 用 途 是 
以 下 述 方 式 为 两 个 不 同 进程 〈 一 个 是 父 进程 ， 一 个 是 子 进 程 ) 提供 进程 间 
的 通信 手段 。 首 先 ， 由 一 个 进程 〈 它 将 成 为 父 进程 ) 创建 一 个 管道 后 调用 
fork 派 生 一 个 自身 的 副本 ， 如 图 4-3 所 示 。 


一 数据 流 一 
图 4-3 单个 进程 内 的 管道 ， 刚 刚 fork 后 
接着 ， 父 进程 关闭 这 个 管道 的 读 出 端 ， 子 进程 关闭 同一 管道 的 写 入 
端 。 这 束 在 父子 进程 间 提 供 了 一 个 单 辣 数 据 流 ， 如 图 4-4 所 示 。 


父 进程 子 进程 


NX 


一 数据 流 一 


图 4-4 两 个 进程 间 的 管道 
who | sort | lp 
我 们 在 某 个 Unix shell 中 输入 一 个 像 下 面 这 样 的 命令 时 : 
该 shell 将 执行 上 述 步 又 创建 三 个 进程 和 其 间 的 两 个 管道 。 它 还 把 每 个 
管道 的 读 出 端 复 制 到 相应 进程 的 标准 输入 ， 把 每 个 管道 的 写 入 端 复制 到 相 
应 进程 的 标准 输出 。 图 4-5 展 示 了 这 样 的 管道 线 。 


who 进 程 sort 进 程 lp 进程 


标准 输出 
标准 输入 


一 数据 流 一 一 数据 流 一 
图 4-5 某 个 shell 管 道 线 中 三 个 进程 间 的 管道 
到 此 为 止 所 示 的 所 有 管道 都 是 半 双 工 的 即 单 向 的 ， 只 提供 一 个 方向 的 
数据 流 。 当 需要 一 个 双向 数据 流 时 ， 我 们 必须 创建 两 个 管道 ， 每 个 方向 一 
个 。 实 际 步骤 如 下 : 
(1) 创 建 管道 1 (fd1[0] 和 fd1[1]) 和 管道 2 \fd2[0] 和 fd2[1]) ; 
(2)fork; 
(3) 父 进程 关闭 管道 1 的 读 出 端 (fd1[0] 
(4) 父 进程 关闭 管道 2 的 写 入 端 (fd2[1] 
(5) 子 进程 关闭 管道 1 的 写 入 端 (fd1[1]) ; 
(6) 子 进程 关闭 管道 2 的 读 出 端 (fd2[0]) 。 
图 4-8 给 出 了 执行 这 些 步 骤 的 代码 。 它 产生 如 图 4-6 所 示 的 管道 布局 。 
例子 
现在 使 用 管道 实现 4.2 方 中 描述 的 客户 一 服务 絮 例 子 。main 画 数 创 建 两 
个 管道 并 用 fork 生 成 一 个 子 进程 。 客 户 然 后 作为 父 进程 运行 ， 服 务 句 则 作 
为 子 进程 运行 。 第 一 个 管道 用 于 从 窗户 辐 服 务 器 发 送 路 径 名 ， 第 二 个 管道 
用 于 从 服务 器 向 客户 发 送 该 文件 的 内 容 (或 者 一 个 出 错 消 息 ) 。 这 样 设置 
后 的 布局 如 图 4-7 所 示 。 


父 进程 子 进程 


fal[1] fa2[1] 
fa2[0] fal [0] 


图 4-6 提供 一 个 双向 数据 流 的 两 个 管道 


未 准 输 入 父 进 程 路 径 名 子 进程 7 
路 径 名 标 住 输入 
文件 内 容 或 — 文件 
出 错 消息 标准 输出 文件 内 容 或 出 错 消息 


图 4-7 使 用 两 个 管道 实现 图 4-1 


注意 图 4-7 所 示 的 两 个 管道 直接 连接 着 两 个 进程 ， 然 而 实际 上 它们 都 是 
通过 内 核 运作 的 ， 如 图 4-6 所 示 。 因 此 ， 从 客户 到 服务 器 以 及 从 服务 器 到 客 
户 的 所 有 数据 都 穿越 了 用 户 - 内 核 接 口 两 次 : 一 次 是 在 写 入 管道 时 ， 另 一 次 
是 在 从 管道 读 出 时 。 

图 4-8 给 出 了 这 个 例子 的 main 函 数 。 


pipe/mainpipe.c 


1 #include "unpipc.h" 
2 void client(int, int), server(int, int); 
3 ant 


4 main(int argc, char **argv) 


6 int pipel[2], pipe2[2]; 
7 pid t childpid; 
8 Pipe (pipel); /* create two pipes */ 
9 Pipe (pipe2) ; 
10 if ( (childpid = Fork()) == 0) { /* child */ 
11 Close (pipel [1] ) ; 
12 Close (pipe2 [0] ) ; 
13 server (pipe1[0], pipe2[11); 
14 exit (0) ; 
15 } 
16 /* parent */ 
17 Close (pipe1[01) ; 
18 Close (pipe2[1]) ; 
19 client (pipe2[0], pipel [1]); 
20 Waitpid(childpid, NULL, 0); /* wait for child to terminate */ 
21 exit (0); 


pipe/mainpipe.c 


图 4-8 使 用 两 个 管道 的 客户 -服务 器 程序 main 画 数 

创建 管道 ，fork 

8 一 19 创建 两 个 管道 ， 然 后 执行 随 图 4-6 列 出 的 6 个 步骤 。 父 进程 调用 
client 函 数 (14-9) , -FXtfEWHiserverERZX (图 4-10) 。 

为 子 进程 waitpid 

20 服务 器 〈 子 进程 ) 在 往 管道 写 入 最 终 数据 后 调用 exit 首 先 终止 。 它 
随后 变 成 了 一 个 僵尸 进程 (zombie) : 自身 已 终止 、 但 其 父 进程 仍 在 运行 
且 疝 未 等 待 该 子 进程 的 进程 。 当 子 进程 终止 时 ， 内 核 还 给 其 父 进程 产生 一 
个 SIGCHLD 信 和 号， 不 过 父 进 程 没有 捕获 这 个 信号 ， 而 该 信号 的 默认 行为 就 
是 忽略 。 此 后 不 久 ， 父 进程 的 dient 范 数 在 从 管道 读 入 最 终 数据 后 返回 。 父 
进程 随后 调用 waitpid 取 得 已 终止 子 进 程 《僵尸 进程 ) 的 终止 状态 。 要 是 父 
进程 没有 调用 waitpid， 而 是 直接 终止 ， 那 么 子 进程 将 成 为 托 孤 给 init 进 程 的 
孤儿 进程 ， 内 核 将 为 此 同 init 井 程 发 送 另外 一 个 SIGCHLD 信 号，init 进 程 随 
后 将 取得 该 僵尸 进程 的 终止 状态 。 

client 函 数 如 图 4-9 所 示 。 


pipe/client.c 
1 #include "unpipc.h" 


2 void 
3 client(int readfd, int writefd) 


5 size t len; 
6 ssize t n; 
7 char buff [MAXLINE] ; 


8 /* read pathname */ 

9 Fgets (buff, MAXLINE, stdin); 

10 len = strlen(buff); /* fgets() guarantees null byte at end */ 
1j if (buff[len-1] == '\n') 

12 len--; /* delete newline from fgets() */ 

13 /* write pathname to IPC channel */ 

1 Write (writefd, buff, len); 

15 /* read from IPC, write to standard output */ 

16 while ( (n = Read(readfd, buff, MAXLINE)) > 0) 

17 Write(STDOUT FILENO, buff, n); 


pipe/client.c 


图 4-9 fi Fd PA Ma HC i T client EX 2 


从 标准 输入 读 进 路 径 名 

8 一 14 从 标准 输入 读 进 路 径 名 后 ， 删 除 其 中 由 fgets 存 入 的 换行 符 ， 再 
写 入 管道 。 

从 管道 复制 到 标准 输出 

157-17 客户 随后 读 出 由 服务 器 写 入 管道 的 全 部 内 容 ， 并 写 到 标准 和 输 
出 。 正 常情 况 下 它 是 所 请 求 文件 的 内 容 ， 但 是 如 果 服 务 器 打 不 开 所 指定 的 
路 径 名 ， 那 它 将 返回 一 个 出 错 消息 。 

server 函 数 如 图 4-10 所 示 。 

从 管道 读 出 路 径 名 

8 一 11 从 管道 读 出 由 客户 写 入 的 路 径 名 ， 并 以 空 字 节 作为 其 结尾 。 注 
意 ， 对 一 个 管道 的 read 只 要 该 管道 中 存在 一 些 数据 就 会 马上 返回 ， 它 不 必 
等 待 达 到 所 请 求 的 字 节 数 (本 例 中 为 MAXLINE) 。 


`, 


pipe/server.c 


1 #include "unpipc.h" 

2 void 

3 server(int readfd, int writefd) 

4 { 

5 int fd; 

6 ssize t n; 

7 char buff [MAXLINE+1] ; 

8 /* read pathname from IPC channel */ 

9 if ( (n = Read(readfd, buff, MAXLINE)) == 0) 

10 err quit("end-of-file while reading pathname") ; 

T1 buff [n] = '\0'; /* null terminate pathname */ 
12 if ( (fd = open(buff, O RDONLY)) < 0) { 

13 /* error: must tell client */ 

14 snprintf (buff + n, sizeof (buff) - n, ": can't open, %s\n", 
15 strerror(errno)); 

16 n = strlen(buff); 

T7. Write(writefd, buff, n); 

18 ) eise ( 

19 /* open succeeded: copy file to IPC channel */ 
20 while ( (n = Read(fd, buff, MAXLINE)) > 0) 

21 Write(writefd, buff, n); 

22 Close (fd); 

23 ) 

24 ) 


pipe/server.c 


图 4-10 使 用 两 个 管道 的 客户 -服务 器 程序 server 函 数 


打开 文件 ， 处 理 错误 

127-17 打开 所 请 求 的 文件 来 读 ， 若 出 错 则 通过 管道 返回 给 客户 一 个 出 
些 消 息 串 。 我 们 调用 strerror 函 数 以 返回 对 应 于 ermo 的 出 错 消息 串 。 

UNPVl 第 690~691 页 详细 讨论 了 strerror 函 数 [1] 。) 

把 文件 复制 到 管道 

18~23 如 果 open 成 功 ， 就 将 该 文件 的 内 容 复 制 到 管道 中 。 

下 面 的 例子 给 出 了 路 径 名 正确 及 发 生 错 误 时 该 程序 的 输出 。 

solaris 96 mainpipe 

letc/inet/ntp.conf 一 个 由 两 行文 本 构成 的 文件 

multicastclient 224.0.1.1 


driftfile /etc/inet/ntp.drift 
solaris 96 mainpipe 
/etc/shadow 一 个 我 们 不 能 读 的 文件 


/etc/shadow: can't open,Permission denied 


solaris 96 mainpipe 


/no/such/file 一 个 不 存在 的 文件 
/no/such/file: can't open,No such file or directory 
4.4 全 双 工 管道 


上 一 忆 中 我 们 提 到 ， 某 些 系统 提供 全 双 工 管道 : SVR4 的 pipe 函 数 以 及 
许多 内 核 都 提供 的 socketpair 函 数 。 那 么 全 双 工 管道 到 底 提 供 什 么 呢 ? 首 
先 ， 我 们 可 以 如 图 4-11 所 示 考 虚 一 个 半 双 工 管道 ， 它 是 对 图 4-2 的 修改 ， 省 
略 了 其 中 的 进程 。 


write read 


far] 一 半 双 工 管 道 一 falo] 


到 4-11 半 双 工 管道 

全 双 工 管道 可 能 实现 成 如 图 4-12 所 示 。 它 隐 含 的 意思 是 : 整个 管道 只 
存在 一 个 缓冲 区 ， (在 任意 一 个 描述 符 上 ) 写 入 管道 的 任何 数据 都 添加 到 
该 缓冲 区 末尾 ， (在 任意 一 个 描述 符 上 ) 从 管道 读 出 的 都 是 取 自 该 缓冲 区 
开头 的 数据 。 


全 双 工 管道 falo] 


fart] 


write 


到 4-12 全 双 工 管道 的 一 个 可 能 实现 〈 不 正确 ) 


这 种 实现 所 存在 的 问题 在 像 图 A-29 这 样 的 程序 中 变 得 很 明显 。 我 们 需 
要 双 疝 通信 ， 但 所 需 的 是 两 个 独立 的 数据 流 ， 每 个 方向 一 个 。 若 不 是 这 
样 ， 当 一 个 进程 往 该 全 双 工 管道 写 入 数据 ， 过 后 再 对 该 管道 调用 read 时 , 
有 可 能 读 回 刚 写 入 的 数据 。 

图 4-13 展 示 了 全 双 工 管道 的 真正 实现 。 


write 一 半 双 工 管 道 一 


-- 半 双 工 管道 -- 


图 4-13 全 双 工 管道 的 真正 实现 
这 儿 的 全 双 工 管道 是 由 两 个 半 双 工 管道 构成 的 。 写 入 fd[1] 的 数据 只 能 
从 fd[0] 读 出 ， 写 入 fd[0] 的 数据 只 能 从 fd[1] 读 出 。 
图 4-14 中 的 程序 表明 可 使 用 单个 全 双 工 管道 完成 双向 通信 。 


fall] 


pipe/fduplex.c 


1 #include "unpipc.h" 
2 ant 
3 main(int argc, char **argv) 
& 1 
5 int fd[2], n; 
6 char c; 
7 pid t childpid; 
8 Pipe(fd); /* assumes a full-duplex pipe (e.g., SVR4) */ 
9 if ( (childpid = Fork()) == 0) { /* child */ 
10 sleep(3); 
3]. if ( (n = Read(fd[0], &c, 1)) != 1) 
12 err quit("child: read returned $d", n); 
13 printf ("child read %c\n", c); 
14 Write(fd[0], "c", 1); 
15 exit (0); 
16 } 
quy /* parent */ 
18 Write(fd[1], "p", 1); 
19 if ( (n = Read(fd[1], &c, 1)) != 1) 
20 err quit("parent: read returned %d", n); 
21 printf ("parent read %c\n", c); 
22 exit(0); 
23 ) 


pipe/fduplex.c 


图 4-14 测试 全 双 工 管道 的 双向 通信 能 

我 们 创建 一 个 全 双 工 管道 后 调用 fork。 父 进程 往 该 管道 写 入 字符 p， 然 
后 从 中 读 出 一 个 字符 。 子 进程 先 睡眠 3 秒 ， 从 该 管道 读 出 一 个 字符 后 ， 往 
它 写 入 子 符 c。 子 进程 中 的 睡眠 古 为 了 让 父 进程 的 read 调 用 先 于 子 进程 的 
read 调 用 执行 ， 从 而 查看 父 进程 是 否 读 回 目 己 刚 写 的 字符 。 

在 提供 全 双 工 管道 的 Solaris 2.6 下 运行 该 程序 ， 我 们 观察 到 了 所 期 望 的 


solaris % fduplex 
child read p 


parent read c 

字符 p 罕 越 图 4-13 中 所 示 顶 部 的 半 双 工 管道 ， 字 符 c 则 罕 越 的 部 的 半 双 
工 管道 。 父 进程 并 没有 读 回 自己 写 入 管道 的 数据 (字符 p) 。 

在 默认 提供 半 双 工 管道 的 Digital Unix 4.0B 下 运行 该 程序 ， 我 们 看 到 了 
半 双 工 管道 的 预期 行为 。 编 译 时 如 有 果 指 定 不 同 的 选项 ， 那 它 也 能 像 SVR4 
那样 提供 全 双 工 管道 。 

alpha 96 fduplex 

read error: Bad file number 

alpha 96 child read p 

write error: Bad file number 

父 进程 写 入 字符 p， 它 由 子 进程 读 出 ， 但 此 后 父 进程 在 试图 从 fd[]] 
read 时 中 止 ， 子 进程 则 在 试图 往 fd[0] write 时 中 止 (回想 图 4-11) 。 由 read 
返回 的 错误 是 EBADF， 和 意思 是 描述 符 fd[1] 不 是 打开 来 读 的 。 类 似 地 ，write 
返回 同样 的 错误 ， 表 示 描 述 符 fd[1] 不 是 打开 来 写 的。 


4.5 popen 和 pclose 函 数 


作为 另 一 个 关于 管道 的 例子 ， 标 准 MO 函 数 库 提 供 了 popen 函 数 ， 它 创 
建 一 个 管道 并 启动 男 外 一 个 进程 ， 该 进程 要 么 从 该 管道 读 出 标准 输入 ， 要 
么 往 该 管道 写 入 标准 输出 。 


include <stdio.h> 


FILE *popen(const char *command,const char *type); 
返回 : 者 成 功 则 为 文件 指针 ， 知 出 错 则 为 NULL 
int pclose(FILE *stream); 
返回 : 若 成 功 则 为 shell 的 终止 状态 ， 若 出 错 则 为 -1 
其 中 command 是 一 个 shell 命 令 行 。 它 是 由 sh 程序 (通常 为 Bourne 
shell) 处 理 的 ， 因 此 PATH 环境 变量 可 用 于 定位 command。popen 在 调用 进 
程 和 所 指定 的 命令 之 间 创 建 一 个 管道 。 由 popen 返 回 的 值 是 一 个 标准 IO 


FILE 指 针 ， 该 指针 或 者 用 于 输入 ， 或 者 用 于 输出 ， 具 体 取决 于 字符 串 
type ° 

如 果 type 为 r， 那 么 调用 进程 读 进 command 的 标准 输出 。 

如 果 type 为 w， 那 么 调用 进程 写 到 command 的 标准 输入 。 

pclose 函 数 关闭 由 popen 创 建 的 标准 WO 流 (stream) ， 等 待 其 中 的 命令 
终止 ， 然 后 返回 shell 的 终止 状态 。 

APUE 的 14.3 [2] 提供 了 popen 和 pclose 的 一 个 实现 。 

例子 

图 4-15 给 出 了 我 们 的 客户 -服务 器 例子 的 男 一 个 实现 ， 它 使 用 popen 函 
数 和 Unix 的 cat 程 序 。8~17 跟 图 4-9 一 样 ， 路 径 名 从 标准 输入 读 出 。 随 后 构 
建 一 个 命令 并 把 它 传递 给 popen。 来 自 shell 或 cat 程 序 的 输出 被 复制 到 标准 
输出 。 


pipe/mainpopen.c 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 size t n; 

6 char buff [MAXLINE] , command [MAXLINE] ; 

7 FILE *fp; 

8 /* read pathname */ 

9 Fgets (buff, MAXLINE, stdin); 

10 n = strlen(buff); /* fgets() guarantees null byte at end */ 
11 if (buff[n-1] == '\n') 

12 n--; /* delete newline from fgets() */ 
13 snprintf (command, sizeof(command), "cat %s", buff); 

14 fp = Popen(command, "r"); 

15 /* copy from pipe to standard output */ 

16 while (Fgets(buff, MAXLINE, fp) != NULL) 

17 Fputs (buff, stdout); 

18 Pclose (fp); 

19 exit(0); 

20 } 


pipe/mainpopen.c 


图 4-15 使 用 popen 的 客户 -服务 器 程序 
这 个 实现 与 图 4-8 中 的 实现 的 差别 之 一 是 : 现在 我 们 依赖 于 由 系统 的 
cat 程 序 产 生 的 出 错 消 轧 ， 而 这 些 消息 往往 不 足以 说 明 具 体 错误 。 例 如 在 


Solaris 2.6 下 ， 当 试图 读 一 个 我 们 没有 读 权限 的 文件 时 ， 将 得 到 如 下 的 错 
V: 

solaris 96 cat /etc/shadow 

cat: cannot open /etc/shadow 

但 是 在 BSD/OS 3.1 下 ， 当 试图 读 一 下 类 似 的 文件 时 ， 将 得 到 一 个 更 清 
晰 的 错误 消息 : 

bsdi 96 cat /etc/master.passwd 


cat: /etc/master.passwd: cannot open [Permission denied] 


还 要 认识 到 在 上 面 的 例子 中 ，popen 调 用 是 成 功 的 ， 但 是 其 后 的 fgets 只 


是 在 首次 被 调用 时 返回 一 个 文件 结束 符 。cat 程 序 将 它 的 出 错 消 息 写 到 标准 
错误 输出 ， 但 popen 不 对 标准 错误 输出 作 任 何 特殊 的 处 理 只 有 标准 输 


出 才 被 重 定 疝 到 由 它 创建 的 管道 。 
4.6 FIFO 


管道 没有 和 名字， 因此 它们 的 最 大 劣势 是 只 能 用 于 有 一 个 共同 祖先 进程 
的 各 个 进程 之 间 。 我 们 无 法 在 无 亲缘 关系 的 两 个 进程 间 创 建 一 个 管道 并 将 
它 用 作 IPC 通 道 〈 不 考虑 描述 符 传 递 ) 。 

FIFO 指 代 先 进 先 出 (first in, first out) ，Unix 中 的 FIFO 类 似 于 管道 。 
它 是 一 个 单 向 ( 半 双 工 ) 数据 流 。 不 同 于 管道 的 是 ， 每 个 FIFO 有 一 个 路 径 
名 与 之 关联 ， 从 而 允许 无 亲缘 关系 的 进程 访问 同一 个 FIFO。FIFO 也 称 为 有 
名 管道 (named pipe) » 

FIFO 由 mkfifo 函 数 创建 。 

#include <sys/types.h> 


#include <sys/stat.h> 
int mkfifo(const char *pathname,mode_t mode); 
返回 : ABTA IO, EEA- 
其 中 pathname 是 一 个 普通 的 Unix 路 径 名 ， 它 是 该 FIFO 的 名 字 。 


mode 参 数 指定 文件 权限 位 ， 类 似 于 open 的 第 二 个 参数 。 图 2-4 给 出 了 
定义 在 <sys/stat.h> 头 文件 中 的 6 个 常 值 ， 用 于 给 一 个 FIFO 指 定 权 限 位 。 

mkfifo 函 数 已 隐 含 指定 OCREAT | O_EXCL。 也 就 是 说 ， 它 要 么 创建 
一 个 新 的 FIFO， 要 么 返回 一 个 EEXIST 错 误 (如 果 所 指定 名 字 的 FIFO 已 经 
FE) 。 如 果 不 希 望 创 建 一 个 新 的 FIFO ， 那 就 改 为 调用 open 而 不 是 
mkfifo。 要 打开 一 个 已 存在 的 FIFO 或 创建 一 个 新 的 FIFO， 应 先 调用 
mkfifo， 再 检查 它 是 否 返 回 EEXIST 错 误 ， 若 返回 该 错误 则 改 为 调用 open 。 

mkfifo 命 令 也 能 创建 FIFO。 可 以 从 shell 脚 本 或 命令 行 中 使 用 它 。 

在 创建 出 一 个 FIFO 后 ， 它 必须 或 者 打开 来 恋 ， 或 者 打开 来 写 ， 所 用 的 
可 以 是 open 函 数 ， 也 可 以 是 某 个 标准 MO 打开 画 数 ， 例 如 fopen。FIFO 不 能 
打开 来 既 读 又 写 ， 因 为 它 是 半 双 工 的 。 

对 管道 或 FIFO 的 write 总 是 往 末尾 添加 数据 ， 对 它们 的 read 则 总 是 从 开 
头 返 回 数 据 。 如 果 对 管道 或 FIFO 调 用 lseek， 那 就 返回 ESPIPE 错 误 。 

4.6.1 例子 

现在 重新 编写 图 4-8 中 的 客户 -服务 器 程序 ， 这 次 改 用 两 个 FIFO 人 代替 两 
个 管道 。client 和 server 函 数 保 持 不 变 ， 所 有 变动 都 在 main 函 数 上 ， 它 如 图 
4-16 所 示 。 

创建 两 个 FIFO 

10-16 在 /tmp 文 件 系 统 中 创建 两 个 FIFO。 这 两 个 FIFO 事 先 存在 与 否 无 
关 紧 要 。 常 值 FILE_MODE 在 我 们 的 unpipc.h 头 文件 (图 C-1) 中 定义 如 下 。 

#define FILE MODE (S IRUSR | S_IWUSR | S_IRGRP | S_IROTH) 

/* default permissions for new files */ 

这 人 允许 用 户 读 、 用 户 写 、 组 成 员 读 和 其 他 用 户 读 。 这 些 权限 位 会 被 当 
前 进程 的 文件 模式 创建 掩 码 修正 。 

fork 

17-27 调用 fork 后 ， 子 进程 调用 我 们 的 server 函 数 (图 4-10) ， 父 进程 
调用 我 们 的 client 函 数 (图 4-9) 。 在 执行 这 些 调用 前 ， 父 进程 打开 第 一 个 


FIFO 来 写 ， 打 开 第 二 个 FIFoO 来 读 ， 子 进程 打开 第 一 个 FIFO 来 读 ， 打 开 第 
二 个 FIFO 来 写 。 这 与 我 们 的 管道 例子 类 似 ， 图 4-17 展 示 了 这 个 布局 。 

这 个 FIFO 例 子 比 起 之 前 的 管道 例子 变动 如 下 。 

创建 并 打开 一 个 管道 只 需 调用 pipe。 创 建 并 打开 一 个 FIFO 则 需 在 调用 
mkfifo 后 再 调用 open 。 

管道 在 所 有 进程 最 终 都 关闭 它 之 后 自动 消失 。FIFO 的 名 字 则 只 有 通过 
调用 unlink 才 从 文件 系统 中 删除 。 

FIFO 需 要 额外 调用 的 好 处 是 ，FIFO 在 文件 系统 中 有 一 个 名 字 ， 该 名 字 
允许 某 个 进程 创建 一 个 FIFO， 与 它 无 亲缘 关系 的 另 一 个 进程 来 打开 这 个 
FIFO。 对 于 管道 来 说 ， 这 是 不 可 能 的 。 


1 #include "unpipc.h" 


2 #define FIFO1 "/tmp/fifo.1" 
3 #define FIFO2 "/tmp/fifo.2" 


4 void client(int, int), server(int, int); 


5 int 

6 main(int argc, char **argv) 
3 3 

8 int readfd, writefd; 
9 pid t  childpig; 


10 /* create two FIFOs; OK if they already exist */ 

11 if ((mkfifo(FIFO1, FILE MODE) < 0) && (errno !- EEXIST)) 
i2 err sys("can't create %s", FIFO1); 

T3 if ((mkfifo(FIFO2, FILE MODE) < 0) && (errno !- EEXIST)) { 
14 unlink (FIFO1) ; 

15 err_sys("can't create $s", FIFO2) ; 

16 } 

T7 if ( (childpid = Fork()) == 0) { /* child */ 

18 readfd = Open(FIFO1, O RDONLY, 0); 

19 writefd = Open(FIFO2, O WRONLY, 0); 

20 server (readfd, writefd) ; 

21 exit (0); 

22 } 

23 /* parent */ 

24 writefd = Open(FIFO1, O WRONLY, 0); 

25 readfd - Open(FIFO2, O RDONLY, 0); 

26 client(readfd, writefd); 

27 Waitpid(childpid, NULL, 0); /* wait for child to terminate */ 
28 Close (readfd) ; 

29 Close (writefd) ; 

30 Unlink (FIFO1) ; 

31 Unlink (FIFO2) ; 

32 exit (0); 

33 } 


pipe/mainfifo.c 


pipe/mainfifo.c 


图 4-16 使 用 两 个 FIFO 的 客户 -服务 器 程序 main 函 数 


父 进程 子 进程 


ET _ 进程 


/tmp/fifo.1 


一 数据 流 一 
/tmp/fifo.2 


一 数据 流 一 


图 4-17 使 用 两 个 FIFO 的 客户 -服务 器 例子 

没有 正确 使 用 FIFO 的 程序 会 发 生 微 妙 的 问题 。 考 虑 图 4-16: 如 果 我 们 
对 换 父 进程 中 两 个 open 调 用 的 顺序 ， 该 程序 就 不 工作 。 其 原因 在 于 ， 如 果 
当前 尚 没有 任何 进程 打开 某 个 FIFO 来 写 ， 那 么 打开 该 FIFO 来 读 的 进程 将 阻 
塞 。 对 换 父 进程 中 两 个 open 调 用 的 顺序 后 ， 父 子 进程 将 都 打开 同一 个 FIFO 
来 读 ， 然 而 当时 并 没有 任何 进程 已 打开 该 文件 来 写 ， 于 是 父子 进程 都 阻 
塞 。 这 种 现象 称 为 死 锁 (deadlock) 。 我 们 将 在 下 一 节 讨 论 这 种 情形 。 

4.6.2 例子 : 无 亲缘 关系 的 客户 与 服务 器 

图 4-16 中 客户 和 服务 器 仍然 是 有 亲缘 关系 的 进程 。 不 过 我 们 可 以 把 这 
个 例子 重新 编写 成 客户 与 服务 器 无 亲缘 关系 的 状态 。 图 4-18 给 出 了 服务 器 
程序 ， 它 与 图 4-16 的 服务 器 部 分 差不多 一 样 。 


pipe/server main.c 


1 #include Vito. he 

2 void server(int, int); 

3; int 

4 main(int argc, char **argv) 

51 

6 int readfd, writefd; 

7 /* create two FIFOs; OK if they already exist */ 

8 if ((mkfifo(FIFO1, FILE MODE) < 0) && (errno !- EEXIST)) 
9 err sys("can't create %s", FIFO1); 

10 if ((mkfifo(FIFO2, FILE MODE) « 0) && (errno !- EEXIST)) { 
Ti unlink (FIFO1); 

12 err sys("can't create $s", FIFO2); 

13 } 

14 readfd = Open(FIFO1, O RDONLY, 0); 

15 writefd = Open(FIFO2, O WRONLY, 0); 

16 server (readfd, writefd) ; 

17 exit (0); 

18 } 


pipe/server main.c 


图 4-18 FAIZ ARS as Fe main HEY 
头 文件 fifo.h 如 图 4-19 所 示 ， 它 提供 了 程序 中 两 个 FIFO 名 字 的 定义 ， 客 
户 和 服务 絮 都 得 知道 它们 。 


pipe/fifo.h 
1 #include "unpipc.h" 
2 #define  FIFO1 "/tmp/fifo.1" 
3 #define FIFO2 "/tmp/fifo.2" 

pipe/fifo.h 


图 4-19 客户 程序 和 服务 器 程序 都 包含 的 fifoh 头 文件 


图 4-20 给 出 了 客户 程序 ， 它 与 图 4-16 的 客户 部 分 差不多 一 样 。 注 意 最 
删除 所 用 FIFO 的 是 客户 而 不 是 服务 器 ， 因 为 对 这 i ee 
2: 

内 核 为 管道 和 FIFO 维 护 一 个 访问 计数 器 ， 它 的 值 是 访问 同一 个 管道 或 
FIFO 的 打开 着 的 描述 入 有 了 访问 计数 器 后 ， 客 户 或 服务 器 就 能 
lo i 函数 从 文件 系统 中 删除 了 所 指定 的 路 径 名 ， 先 前 

经 打开 该 路 径 名 、 oa 守 却 不 受 影响 。 
然而 对 于 其 他 形式 的 IPC 来 说 (例如 System V 消 息 队 列 ) ， 这 样 的 计 
数 器 并 不 存在 ， 因 此 要 是 服务 器 在 向 某 个 消息 队列 写 入 自己 的 最 终 消息 后 


mm nn 
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pipe/client main.c 


1 #include "fifo.h" 

2 void client (int, int); 
3 int 

4 main(int argc, char **argv) 
5 { 


6 int readfd, writefd; 

7 writefd = Open(FIFO1, O WRONLY, 0); 
8 readfd = Open(FIFO2, O RDONLY, 0); 
9 client (readfd, writefd) ; 

10 Close (readfd) ; 

T Close (writefd); 

2 Unlink (FIFO1) ; 

13 Unlink (FIFO2) ; 

14 exit (0); 

15 } 


pipe/client_main.c 


图 4-20 独立 客户 程序 main 函 数 

为 运行 这 对 客户 和 服务 器 ， 先 在 后 人 台 局 动 服务 句 : 

% server file & 

再 启动 客户 。 男 一 种 办 法 是 只 局 动 客户 ， 服 务 器 则 由 客户 通过 调用 
fork 和 和 exec 来 激活 。 客 户 还 可 以 把 所 用 的 两 个 FIFO 的 名 字 作 为 命令 行 参数 
通过 exec 函 数 传递 给 服务 句 ， 从 而 不 必 将 它们 编写 到 一 个 头 文件 中 。 不 过 
这 种 情形 会 使 得 服务 器 成 为 客户 的 一 个 子 进 程 ， 这 么 一 来 管道 就 够 用 了 。 


4.7 管道 和 FIFO 的 额外 属性 


我 们 需要 就 管道 和 FIFO 的 打开 、 读 出 和 写 入 更 为 详细 地 描述 它们 的 某 
些 属性 。 首 先 ， 一 个 描述 符 能 以 两 种 方式 设置 成 非 阳 塞 。 

(1) 调 用 open 时 可 指定 O_NONBLOCK 标 志 。 例 如 图 4-20 中 第 一 个 open 
调用 可 以 是 : 

writefd = Open(FIFO1,0 WRONLY | O NONBLOCK,0); 

(2) 如 果 一 个 描述 符 已 经 打开 ， 那 么 可 以 调用 fentl 以 启用 
O_NONBLOCK 标 志 。 对 于 管道 来 说 ， 必 须 使 用 这 种 技术 ， 因 为 管道 没有 


open 调 用 ， 在 pipe 调 用 中 也 无 法 指定 O_NONBLOCK 标 志 。 使 用 fcnt 时 ， 我 
们 移 使 用 F_GETFL 命 令 取得 当前 文件 状态 标志 ， 将 它 与 O_ NONBLOCK 标 
志 按 位 或 后 ， 再 使 用 F_SETFL 命 令 存储 这 些 文件 状态 标志 : 
int flags; 
if ( (flags = fentl(fd,F_GETFL.,0))< 0) 
err sys("F GETFL error"); 
flags |- O NONBLOCK; 
if (fcntl(fd,F SETFL,flags)« 0) 
err sys("F SETFL error"); 
留心 你 可 能 会 碰 到 的 人 简单 地 设置 所 需 标志 的 代码 ， 因 为 这 样 的 代码 在 
设置 所 需 标志 的 同时 请 除了 所 有 其 他 可 能 存在 的 文件 状态 标志 : 
/* wrong way to set nonblocking */ 
if (fentl(fd,F_SETFL,O_NONBLOCK)< 0) 
err sys("F SETFL error"); 
图 4-21 给 出 了 非 阻 塞 标志 对 打开 一 个 FIFO 的 影响 、 对 从 一 个 空 管道 或 
空 FIFO 读 出 数据 的 影响 以 及 对 往 一 个 管道 或 FIFO 写 入 数据 的 影响 。 


当前 操作 管道 或 FIFO 的 返 回 
现 有 打开 操作 阻塞 〈 默 认 设 置 ) O_NONBLOCK 设 置 
open FIFO FIFO 打 开 来 写 成 功 返回 成 功 返 回 
B FIFO 不 是 打开 来 写 阻塞 到 FIFO 打 开 来 写 为 止 成 功 返回 
open FIFO FIFO 打 开 来 读 成 功 返回 成 功 返 回 
AS FIFO 不 是 打开 来 读 阻塞 到 FIFO 打 开 来 读 为 止 返回 ENXIO 错 误 
从 空 管道 或 管道 或 FIFO 打 开 来 写 阻塞 到 管道 或 FIFO 中 有 数据 或 者 | 返回 EAGAIN 错 误 
Nae 管道 或 FIFO 不 再 为 写 打开 着 为 止 
FIFO read -e — : : = : = z 
管道 或 FIFO 不 是 打开 来 写 read 返 回 0 (文件 结束 符 ) read 返 回 0 (文件 结束 符 ) 
往 管 道 或 | 管道 或 FIFO 打 开 来 读 ( 见 正 文 ) 〈 见 正文 ) 


FIFO write 管道 或 FIFO 不 是 打开 来 读 给 线程 产生 SITGPIPE 给 线程 产生 SITGPIPE 


&l4-21 O_NONBLOCK 标 志 对 管道 和 FIFO 的 影响 
下 面 是 关于 管道 或 FIFO 的 读 出 与 写 入 的 若干 额外 规则 。 
如 果 请 求 读 出 的 数据 量 多 于 管道 或 FIFO 中 当前 可 用 数据 量 ， 那 么 只 返 
回 这 些 可 用 的 数据 。 我 们 必须 准备 好 处 理 来 自 read 的 小 于 所 请 求 数目 的 返 


回 值 。 

如 果 请 求 写 入 的 数据 的 字 节 数 小 于 或 等 于 PIPE_BUF (一 个 Posix 限 制 
值 ， 将 在 4.11 节 详细 讨论 ) ， 那 么 write 操作 保证 是 原子 的 。 这 意味 着 ， 如 
果 有 两 个 进程 差不多 同时 往 同 一 个 管道 或 FIFO 写 ， 那 么 或 者 先 写 入 来 自 第 
一 个 进程 的 所 有 数据 ， 再 写 入 来 自 第 二 个 进程 的 所 有 数据 ， 或 者 颠倒 过 
来 。 系 统 不 会 相互 混杂 来 自 这 两 个 进程 的 数据 。 然 而 ， 如 果 请 求 写 入 的 数 
据 的 字 市 数 大 于 PIPE_BUF， 那 么 write 操 作 不 能 保证 是 原子 的 。 

Posix.1 要 求 PIPE_BUF 至 少 为 512 字 节 。 常 见 的 值 处 于 从 BSD/0S 3.1 的 
1024 到 Solaris 2.6 的 5120 之 间 。4.11 节 有 一 个 程序 可 输出 这 个 值 。 

O_NONBLOCK 标 志 的 设置 对 write 操作 的 原子 性 没有 影响 一 原子 性 
完全 是 由 所 请 求 字 节 数 是 否 小 于 等 于 PIPE_BUF 决 定 的 。 然 而 当 一 个 管道 
或 FIFO 设 置 成 非 阻 塞 时 ， 来 自 write 的 返回 值 取 决 于 待 写 的 字 节 数 以 及 该 管 
道 或 FIFO 中 当前 可 用 空间 的 大 小 。 如 有 果 待 写 的 字 市 数 小 于 等 于 
PIPE BUF: 

a. 如 宁 该 管道 或 FIFO 中 有 足以 存放 所 请 求 字数 的 空间 ， 那 么 所 有 数 
据 字 节 都 写 入 。 

b. 如 果 该 管道 或 FIFO 中 没有 足以 存放 所 请 求 字 市 数 的 空间 ， 那 么 立即 
返回 一 个 EAGAIN 错 误 。 有 既然 设置 了 O_NONBLOCK 标 志 ， 调 用 进程 就 不 
希望 自己 被 投入 睡眠 中 。 但 是 内 核 无 法 在 接受 部 分 数据 的 同时 仍 保证 write 
操作 的 原子 性 ， 于 是 它 必须 返回 一 个 错误 ， 告 诉 调用 进程 以 后 再 试 。 

WARES BIA BAUM PIPE BUF: 

a. 如 果 该 管道 或 FIFO 中 至 少 有 1 字 节 空间， 那么 内 核 写 入 该 管道 或 
FIFO 能 容纳 数目 的 数据 字 节 ， 该 数目 同时 作为 来 自 write 的 返回 值 。 

b. 如 果 该 管道 或 FIFO 已 满 ， 那 么 立即 返回 一 个 EAGAIN 错 误 。 

如 果 向 一 个 没有 为 读 打开 着 的 管道 或 FIFO 写 入 ， 那 么 内 核 将 产生 一 个 
SIGPIPE 信 号 : a. 如 果 调 用 进程 既 没 有 捕获 也 没有 名 上 略 该 SIGPIPE 信 和 号， 所 
采取 的 默认 行为 残 是 终止 该 进程 。 


b. 如 果 调 用 进程 忽略 了 该 SIGPIPE 信 和 号， 或 者 捕获 了 该 信号 并 从 其 信和 号 
处 理 程序 中 返回 ， 那 么 write 返回 一 个 EPIPE 错 误 © 

SIGPIPE 被 认为 是 一 个 同步 信号 ， 也 丈 是 说 ， 这 是 一 个 由 特定 的 线程 
(调用 write 的 线程 ) 引起 的 信号 。 然 而 处 理 这 个 信号 最 容易 的 办 法 是 忽略 
它 (把 它 的 处 理 办 法 设置 成 SIG-IGN) ， 让 write 返回 一 个 EPIPE 错 误 。 应 
用 程序 应 该 无 遗漏 地 检测 由 write 返回 的 错误 ， 而 检测 某 个 进程 被 SIGPIPE 
终止 却 困难 得 多 。 如 果 该 信号 未 被 捕获 ， 我 们 就 得 从 shell 中 查看 被 终止 进 
程 的 终止 状态 ， 以 确定 该 进程 是 否 被 某 个 信号 所 杀 死 以 及 具体 是 被 哪个 信 
号 杀 死 的 。UNPVI 的 5.13 节 详细 讨论 SIGPIPE ° 


4.8 单个 服务 器 ， 多 个 客户 


FIFO 的 真正 优势 表现 在 服务 器 可 以 是 一 个 长 期 运行 的 进程 (例如 守护 
进程 ， 如 UNPvl 第 12 章 所 述 ) ， 而 且 与 其 客户 可 以 无 亲缘 关系 。 作 为 服务 
恬 的 守护 进程 以 某 个 众所周知 的 路 径 名 创建 一 个 FIFO， 并 打开 该 FIFO 来 
读 。 此 后 某 个 时 刻 启动 的 客户 打开 该 FIFO 来 写 ， 并 将 其 命令 或 给 守护 进程 
的 其 他 任何 东西 通过 该 FIFO 发 送出 去 。 使 用 FIFO 很 容易 实现 这 种 形式 的 单 
向 通信 (从 客户 到 服务 器 ; ， 但 是 如 果 守 护 进 程 需要 向 客户 发 送 回 一 些 东 
西 ， 事情 就 困难 了 。 图 4-22 是 我 们 随 例子 使 用 的 技巧 。 


服务 器 


文件 内 容 


/tmp/fifo.1234 /tmp/fifo.9876 


PID， 路 径 名 


PID， 路 径 名 


PID 1234 PID 9876 


图 4-22 单个 服务 器 ， 多 个 客户 


服务 器 以 一 个 众所周知 的 路 径 名 〈 本 例 中 为 /mpyfifo.serv) 创建 一 个 
FIFO， 它 将 从 这 个 FIFO 读 入 客户 的 请 求 。 每 个 客户 在 启动 时 创建 自己 的 
FIFO， 所 用 的 路 径 名 含有 自己 的 进程 ID。 每 个 客户 把 自己 的 请 求 写 入 服务 
器 的 众所周知 FIFO 中 ， 该 请 求 含 有 客户 的 进程 ID 以 及 一 个 路 径 名 ， 具 有 该 
路 径 名 的 文件 就 是 客户 希望 服务 器 打开 并 发 回 的 文件 。 

图 4-23 给 出 了 服务 器 程序 。 

创建 众所周知 FIFO ， 打 开 来 读 ， 打 开 来 写 

10~15 创建 服务 器 的 众所周知 FIFO， 就 算 它 已 经 存在 也 没 问 题 。 接 着 
打开 该 管道 两 次 ， 一 次 只 读 ， 一 次 只 写 。readfifo 描 述 符 用 于 读 出 到 达 该 
FIFO 的 每 个 客户 请 求 ，dummyfd 摘 述 符 则 从 来 不 用 。 打 开 该 FIFO 来 写 的 原 
因 可 从 图 4-21 中 看 出 。 要 是 我 们 不 这 么 做 ， 那 么 每 当 有 一 个 客户 终止 时 ， 
该 FIFO 就 变 空 ， 于 是 服务 器 的 read 返 回 0， 表 示 是 一 个 文件 结束 符 。 我 们 将 
不 得 不 close 该 FIFO， 并 以 O_RDONLY 标 志 再 次 调用 open， 不 过 该 调用 会 
一 直 阻 塞 到 下 一 个 客户 请 求 到 达 为 止 。 然 而 如 果 我 们 总 是 有 一 个 该 FIFO 的 
描述 符 打开 着 用 于 写 ， 那 么 当 不 再 有 客户 存在 时 ， 服 务 器 的 read 一 定 不 会 
返回 0 以 指示 读 到 一 个 文件 结束 符 。 相 反 ， 服 务 器 只 是 阻塞 在 read 调 用 中 ， 


等 待 下 一 个 客户 请 求 。 于 是 这 个 技巧 消化 了 我 们 的 服务 需 代 码 ， 诚 少 了 为 


其 众所周知 FIFO 调 用 open 的 次 数 。 


fifocliserv/mainserver.c 


1 #include WES b" 

2 void server(int, int); 

3 int 

4 main(int argc, char **argv) 

5 ( 

6 int readfifo, writefifo, dummyfd, fd; 

7 char *ptr, buff [MAXLINE+1], fifoname [MAXLINE] ; 

8 pid t pid; 

9 ssize t n; 
10 /* create server's well-known FIFO; OK if already exists */ 
lek if ((mkfifo(SERV FIFO, FILE MODE) < 0) && (errno != EEXIST)) 
12 err sys("can't create $s", SERV FIFO); 

13 /* open server's well-known FIFO for reading and writing */ 
14 readfifo - Open(SERV FIFO, O RDONLY, 0); 

15 dummyfd - Open(SERV FIFO, O WRONLY, 0); /* never used */ 
16 while ( (n = Readline(readfifo, buff, MAXLINE)) > 0) { 

17 if (buff[n-1] == '\n') 

18 n--; /* delete newline from readline() */ 
19 buff [n] = '\0'; /* null terminate pathname */ 
20 if ( (ptr = strchr(buff, ' ')) == NULL) { 
21 err msg("bogus request: %s", buff); 
22 continue; 
23 } 
24 *ptr++ = 0; /* null terminate PID, ptr = pathname */ 
25 pid = atol (buff); 
26 snprintf(fifoname, sizeof (fifoname), "/tmp/fifo.$1d", (long) pid); 
27 if ( (writefifo = open(fifoname, O WRONLY, 0)) < 0) { 
28 err msg("cannot open: $s", fifoname) ; 
29 continue; 

30 ) 
31 if ( (fd = open(ptr, O RDONLY)) < O) ( 

32 /* error: must tell client */ 
33 snprintf (buff + n, sizeof(buff) - n, ": can't open, %s\n", 
34 strerror(errno)); 
35 n - strlen(ptr); 

36 Write(writefifo, ptr, n); 

37 Close (writefifo); 

38 ) eise { 

39 /* open succeeded: copy file to FIFO */ 
40 while ( (n = Read(fd, buff, MAXLINE)) > 0) 

41 Write(writefifo, buff, n); 

42 Close(fd); 
43 Close (writefifo); 

44 ) 

45 ) 

46 exit(0); 
Az} 


服务 器 启动 时 ， 它 的 第 一 个 open (使 用 O_RDONLY 标 志 ) 将 阻塞 到 第 


cR p EE 。 它 的 第 二 个 open 


图 4-23 处 理 多 个 客户 请 求 的 FIFO 服 务 器 程序 


写 打 开 服 务 器 的 FIFO 为 止 (回想 图 4-21) 


fifocliserv/mainserver.c 


(f& HO WRONLY tras) 则 立即 返回 ， 因 为 该 FIFO 已 经 打开 着 用 于 读 
了 。 
读 出 客户 请 求 
16 每 个 客户 请 求 是 由 进程 ID、 一 个 空格 再 加 路 径 名 构成 的 单行 。 我 们 
使 用 自己 的 readline 函 数 ( 见 UNPVI 第 79 页 ) 。 

分 析 客 户 请 求 

17~ 26 删除 通常 由 readline 返 回 的 换行 符 。 该 换行 符 只 有 在 这 样 两 种 
情况 下 才 会 拉 掉 : 遇 到 它 之 前 缓冲 区 已 填 满 ， 或 者 输入 的 最 后 一 行 不 是 以 
换行 符 终 止 。 由 strchr 函 数 返回 的 赋 给 ptr 的 指针 指向 客户 请 求 行 中 的 空格 ， 
ptr 增 1 后 即 指向 后 跟 的 路 径 名 的 首 字符 。 客 户 的 FIFO 的 路 径 名 是 根据 其 进 
程 ID 构 造 的 ， 服 务 器 以 只 写 的 方式 打开 该 FIFO。 

打开 客户 请 求 的 文件 ， 将 它 发 送 到 客户 的 FIFO 

27~44 服务 器 的 剩余 部 分 类 似 于 图 4-10 中 的 server 函 数 。 它 打开 客户 
请 求 的 文件 ， 若 失败 则 通过 客户 的 FIFO 向 客户 返回 一 个 出 错 消息 。 若 open 
成 功 则 把 文件 的 内 容 复制 到 客户 的 FIFO 中 。 完 成 后 close 客 户 的 FIFO 的 服务 
器 端 ， 以 使 得 客户 的 read 返 回 0 (文件 结束 符 ) 。 服 务 器 不 删除 客户 的 
FIFO， 这 个 工作 由 客户 在 读 出 来 自 服务 器 的 文件 结束 符 后 完成 。 

客户 程序 在 图 4-24 中 给 出 。 


fifocliserv/mainclient.c 


1 #include "Ffito:h" 

2 int 

3 main(int argc, char **argv) 

€ 

5 int readfifo, writefifo; 

6 size t len; 

7 ssize t n; 

8 char *ptr, fifoname [MAXLINE], buff [MAXLINE] ; 

9 pid t pid; 

10 /* create FIFO with our PID as part of name */ 

11 pid = getpid(); 

12 snprintf(fifoname, sizeof(fifoname), "/tmp/fifo.%ld", (long) pid); 
13 if ((mkfifo(fifoname, FILE MODE) < 0) && (errno !- EEXIST)) 

14 err sys("can't create $s", fifoname); 

15 /* start buffer with pid and a blank */ 

16 snprintf (buff, sizeof (buff), "$1d ", (long) pid); 

17 len = strlen(buff); 

18 ptr = buff + len; 

19 /* read pathname */ 

20 Fgets(ptr, MAXLINE - len, stdin); 

Zl len = strlen(buff); /* fgets() guarantees null byte at end */ 
22 /* open FIFO to server and write PID and pathname to FIFO */ 
23 writefifo - Open(SERV FIFO, O WRONLY, 0); 

24 Write(writefifo, buff, len); 

25 /* now open our FIFO; blocks until server opens for writing */ 
26 readfifo - Open(fifoname, O RDONLY, 0); 

27 /* read from IPC, write to standard output */ 

28 while ( (n = Read(readfifo, buff, MAXLINE)) > 0) 

29 Write(STDOUT FILENO, buff, n); 

30 Close (readfifo); 

31 Unlink(fifoname); 

32 exit (0); 

33 ) 


fifocliserv/mainclient.c 


图 4-24 与 图 4-23 中 服务 器 程序 协同 工作 的 客户 程序 


创建 FIFO 

107-14 客户 的 FIFO 是 使 用 以 进程 ID 作为 其 最 后 一 部 分 的 路 径 名 创建 
的 。 

构建 客户 请 求 行 

15~21 客户 的 请 求 由 其 进程 ID、 一 个 空格 、 一 个 路 径 名 和 一 个 换行 符 
构成 ， 其 中 的 路 径 名 指 代 请 求 服 务 器 发 送 给 本 客户 的 文件 。 这 个 请 求 行 在 
字符 数组 buff 中 构建 ， 路 径 名 则 从 标准 输入 读 入 。 

打开 服务 器 的 FIFO， 写 入 请 求 

227-24 打开 服务 器 的 FIFO 后 往 其 中 写 入 请 求 。 如 果 本 客户 是 自 服务 器 
启动 以 来 第 一 个 打开 该 FIFO 的 客户 ， 那 么 这 儿 的 open 将 把 服务 器 从 它 的 
open 调 用 (使 用 O_RDONLY 标 志 ) 中 解 阻塞 出 来 。 


读 出 来 自 服 务 器 的 文件 内 容 或 出 错 消息 

25~31 从 本 客户 的 FIFO 中 读 出 服务 器 的 应 答 ， 并 写 到 标准 输出 。 随 后 
关闭 并 删除 该 FIFO 。 

我 们 可 以 在 一 个 窗口 中 启动 服务 器 ， 在 另 一 个 窗口 中 运行 客户 ， 它 们 
将 如 期 地 工作 。 下 面 给 出 的 只 是 客户 的 交互 例子 。 


solaris % mainclient 


/etc/shadow 一 个 我 们 不 能 读 
的 文件 

/etc/shadow: can't open,Permission denied 

solaris 96 mainclient 

letc/inet/ntp.conf 一 个 由 2 行文 本 构成 的 


文件 
multicastclient 224.0.1.1 
driftfile /etc/inet/ntp.drift 


我 们 还 可 以 从 shell 中 与 服务 器 交互 ， 因 为 FIFO 在 文件 系统 中 有 和 名字 。 


solaris % Pid=$$ 本 shell 时 进程 ID 
solaris % mkfifo /tmp/fifo.$Pid 创建 客户 的 FIFO 
solaris 96 echo "$Pid /etc/inet/ntp.conf" > /tmp/fifo.serv 

solaris 96 cat < /tmp/fifo.$Pid 读 出 服务 器 的 应 答 


multicastclient 224.0.1.1 

driftfile /etc/inet/ntp.drift 

solaris 96 rm /tmp/fifo.$Pid 

我 们 用 一 个 shell 命 令 (echo) 把 客户 (本 shell) 的 进程 ID 和 所 请 求 的 
路 径 名 发 送 给 服务 器 ， 用 另 一 个 命令 (cat) 读 出 服务 器 的 应 答 。 这 两 个 命 
令 之 间 可 相隔 任意 长 度 的 时 间 。 这 么 一 来 ， 表 面 上 看 先 由 服务 器 往 客户 的 
FIFO 中 写 文 件 ， 再 由 客户 执行 cat 命 令 从 该 FIFO 中 读 出 数据 ， 这 样 的 表象 
可 能 会 使 我 们 认为 即使 没有 进程 打开 着 客户 的 FIFO， 数 据 也 会 以 某 种 方式 
存留 于 该 FIFO 中 。 但 事情 并 不 是 这 样 ， 真 正 的 规则 是 : 当 对 一 个 管道 或 


FIFO 的 最 终 close 发 生 时 ， 该 管道 或 FIFO 中 的 任何 残余 数据 都 被 丢弃 。 在 我 
们 的 shell 例 子 中 ， 服 务 器 读 出 客户 的 请 求 行 后 ， 会 阻塞 在 对 客户 的 FIFO 的 
open 调 用 中 ， 因 为 客户 〈 即 我 们 的 shell) 还 没有 打开 该 FIFO 来 读 (回想 图 
4-21) 。 服 务 器 对 该 FIFO 的 open 调 用 一 直 阻 塞 到 我 们 在 以 后 某 个 时 候 执行 
cat 命 令 为 止 ， 该 命令 打开 这 个 FIFO 来 恋 ， 服 务 絮 的 open 调 用 随 之 返回 。 这 
种 时 间 顺 序 关 系 还 会 导致 拒绝 服务 (denial-of-service) 型 攻击 ， 我 们 将 在 
下 一 节 讨 论 。 

使 用 shell 还 允许 简单 测试 服务 器 的 出 错 处 理 。 我 们 可 以 简单 地 向 服务 
器 发 送 一 行 不 带 进程 ID 的 请 求 ， 也 可 以 向 它 发 送 一 行 所 带 进程 ID 在 /tmp 目 
录 中 没有 对 应 的 FIFO 的 请 求 。 举 例 来 说 ， 如 果 在 启动 服务 器 后 输入 如 下 
行 : 


solaris 96 cat > /tmp/fifo.serv 


/no/process/id 

999999 /invalid/process/id 

那么 服务 器 的 输出 〈 在 另 一 个 窗口 中 ) 如 下 : 

solaris 96 server 

bogus request: /no/process/id 

cannot open: /tmp/fifo.999999 

4.8.1 FIFO write 的 原子 性 

本 世 介 绍 的 简单 客户 -服务 书 程 序 还 能 让 我 们 体会 到 管道 和 FIFO 的 
write 操作 的 原子 性 相当 重要 。 假 设 有 两 个 客户 差不多 同时 间 服 务 右 发 送 请 
求 。 第 一 个 客户 的 请 求 行 如 下 : 

1234 /etc/inet/ntp.conf 

第 二 个 客户 的 请 求 行 如 下 : 

9876 /etc/passwd 

假设 每 个 客户 给 目 己 的 请 求 行 执行 单个 write 函数 调用 ， 而 且 每 个 请 求 
行 都 小 于 或 等 于 PIPE_BUF (这 样 假设 是 合理 的 ， 因 为 PIPFE_BUF 通 常 在 


1024 和 5120 之 间 ， 而 路 径 名 往往 限制 成 最 多 1024 字 节 ) ， 那 么 系统 保证 该 
FIFO 中 的 数据 或 者 是 

1234 /etc/inet/ntp.conf 

9876 /etc/passwd 

或 者 是 

9876 /etc/passwd 

1234 /etc/inet/ntp.conf 

该 FIFO 中 的 数据 不 会 像 是 下 面 的 模样 : 

1234 /etc/inet9876 /etc/passwd 

/ntp.conf 

4.8.2 FIFO 与 NFS 的 关系 

FIFO 是 一 种 只 能 在 单 台 主 机 上 使 用 的 IPC 形 式 。 尽 管 在 文件 系统 中 有 
名 字 ， 它 们 也 只 能 用 在 本 地 文件 系统 上 ， 而 不 能 用 在 通过 NFS 安 装 的 文件 
RAES 

solaris % mkfifo /nfs/bsdi/usr/rstevens/fifo.temp 

mkfifo: I/O error 

上 面 的 例子 中 ， 文 件 系统 /nfs/bsdi/usr 是 主机 bsdi 上 的 /usr 文 件 系 统 。 

有 些 系 统 (例如 BSD/OS) 确实 允许 在 通过 NFS 安 装 的 文件 系统 上 创建 
FIFO， 但 是 数据 无 法 在 这 样 的 两 个 系统 间 通 过 这 些 FIFO 传 递 。 这 种 情形 
下 ，FIFO 只 是 用 作 同 一 主机 上 客户 和 服务 器 之 间 位 于 文件 系统 中 的 集结 
点 。 即 使 在 不 同 主机 上 的 某 两 个 进程 都 能 通过 NFS 打 开 同 一 个 FIFO， 它 们 
也 不 能 通过 该 FIFO 从 一 个 进程 向 男 一 个 进程 发 送 数 据 。 


4.9 Xj EAST BR AT SR IE ALB OT SR 


上 一 节 的 简单 客户 -服务 器 程序 例子 中 ， 服 务 器 是 一 个 迭代 服务 需 
(iterative server) 。 它 逐一 处 理 客 户 请 求 ， 而 且 是 在 完全 处 理 每 个 客户 的 
请 求 后 再 接待 下 一 个 客户 。 举 例 来 说 ， 如 果 有 两 个 客户 几乎 同时 向 服务 吉 
发 送 一 个 请 求 一 一 第 一 个 客户 请 求 一 个 10M 字 节 的 文件 ， 服 务 器 把 它 发 送 


给 该 客户 需 花 ( 壁 如 说 ) 10 秒 ， 第 二 个 客户 请 求 一 个 10 字 节 的 文件 一 一 那 
么 第 二 个 客户 必须 等 待 至 少 10 秒 ， 以 让 第 一 个 客户 的 请 求 被 处 理 完 。 

另 一 种 设计 是 并 发 服务 器 (concurrent server) 。Unix 下 最 常见 的 并 发 
服务 器 类 型 称 为 每 个 客户 一 个 子 进 程 (one-child-per-client) 服务 器 ， 每 当 
有 一 个 客户 请 求 到 达 时 ， 这 种 服务 器 就 让 主 进 程 调 用 fork 派 生出 一 个 新 的 
子 进程 。 该 新 子 进程 处 理 相 应 的 客户 请 求 ， 直 到 完成 为 止 ， 而 Unix 的 多 程 
序 运 行 特性 提供 了 所 有 不 同 进程 间 的 并 发 性 。UNPVl 第 27 章 还 详细 讨论 了 
其 他 并 发 服务 器 设计 技巧 。 

创建 一 个 子 进 程 池 ， 让 池 中 某 个 空闲 子 进 程 为 一 个 新 的 客户 服务 。 

为 每 个 客户 创建 一 个 线程 。 

创建 一 个 线程 池 ， 让 池 中 某 个 空 朵 线程 为 一 个 新 的 客户 服务 。 

尽管 UNPvl 中 的 讨论 是 针对 网 络 服务 器 的 ， 同 样 的 技巧 也 适用 于 IPC 服 
务 器 ， 差 别 只 是 IPC 服 务 器 的 客户 总 是 跟 服 务 器 运行 在 同一 主机 上 。 

拒绝 服务 型 攻击 

我 们 已 提 及 迭代 服务 器 的 一 个 问题 一 一 某 些 客户 必须 等 待 比 预期 要 长 
的 时 间 ， 因 为 它们 被 排 在 请 求 处 理 时 间 较 长 的 其 他 客户 之 后 一 一 然而 还 存 
在 另 一 个 问题 。 回 想 上 一 节 中 从 shell 完 成 与 服务 器 交互 的 例子 ， 我 们 讨论 
了 当 客 户 还 没有 打开 自己 的 FIFO 时 (客户 的 打开 操作 要 到 我 们 执行 cat 命 令 
时 才 发 生 ) ,服务 器 是 怎样 阻塞 在 对 该 FIFO 的 open 调 用 上 的 。 这 意味 着 某 
个 恶意 的 客户 可 以 让 服务 器 处 于 停顿 状态 ， 办 法 是 给 它 发 送 一 个 请 求 行 ， 
但 从 来 不 打开 自己 的 FIFO 来 读 。 这 称 为 拒绝 服务 (DoS) 型 攻击 。 为 避免 
这 种 攻击 ， 在 编写 任何 服务 器 程序 的 迭代 部 分 时 必须 小 心 ， 要 留意 服务 屁 
可 能 在 哪儿 阻塞 以 及 可 能 阻塞 多 久 。 处 理 这 种 问题 的 方法 之 一 是 在 特定 操 
作 上 设置 一 个 超时 时 钟 ， 但 是 把 服务 器 程序 编写 成 并 发 服务 器 而 不 是 迭代 
服务 器 通常 更 为 简单 ， 这 么 一 来 ， 上 述 类 型 的 拒绝 服务 型 攻击 只 影响 一 个 
子 进 程 ， 而 不 会 影响 主 服 务 器 。 即 使 采用 并 发 服务 器 ， 拒 绝 服务 型 攻击 仍 
可 能 发 生 : 一 个 恶意 的 客户 可 能 发 送 大 量 的 独立 请 求 ， 导 致 服务 器 达到 它 
的 子 进 程 数 限制 ， 从 而 使 得 后 续 的 fork 失 败 。 


4.10 字 节 流 与 消息 


到 此 为 止 所 给 出 的 使 用 管道 和 FIFO 的 例子 都 使 用 字 节 流 1O 模 型 ， 这 
是 Unix 的 原生 IO 模型 。 这 种 模型 不 存在 记录 边界 ， 也 就 是 说 读 写 操作 根本 
不 检查 数据 。 举 例 来 说 ， 从 某 个 FIFO 中 读 出 100 个 字 节 的 进程 无 法 判定 往 
该 FIFO 中 写 入 这 100 个 字 市 的 进程 执行 了 单个 100 字 节 的 写 操作 、5 个 20 字 
节 的 写 操作 、2 个 50 字 市 的 写 操作 还 是 另外 某 种 总 共 为 100 字 节 的 写 操 作 的 
组 合 。 一 个 进程 往 该 FIFO 中 写 入 55 个 字 节 后 ， 男 一 个 进程 再 写 入 45 字 节 ， 
这 样 的 情况 同样 是 可 能 的 。 这 样 的 数据 是 一 个 字 节 流 (byte stream) ， 系 
统 不 对 它 作 解释 。 如 果 需 要 某 种 解释 ， 写 进程 和 读 进 程 束 得 先 验 [3] 地 同 
意 这 种 解释 ， 并 亲自 去 做 。 

有 时 候 应 用 希望 对 所 传送 的 数据 加 上 某 种 结构 。 当 数据 由 长 度 可 变 消 
息 构 成 ， 并 且 读 出 者 必须 知道 这 些 消 息 的 边界 以 判定 何 时 已 读 出 单个 消息 
时 ， 这 种 需求 可 能 发 生 。 下 面 三 种 技巧 经 常用 于 这 个 目的 。 

(1) 带 内 特殊 终止 序列 许多 Unix 应 用 程序 使 用 换行 符 来 分 隔 每 个 消 
上 筷 。 写 进程 会 给 每 个 消息 添加 一 个 换行 符 ， 读 进程 则 每 次 读 出 一 行 。 图 4- 
23 和 图 4-24 中 的 客户 程序 和 服务 器 程序 就 用 这 种 方法 分 隔 各 个 客户 请 求 。 
这 种 技巧 一 般 要 求 数据 中 任何 出 现 分 隔 符 处 都 作 转 义 处 理 〈 也 就 是 说 以 某 
种 方式 把 它们 标志 成 数据 ， 而 不 是 作为 分 隔 符 ) 。 

许多 因特网 应 用 程序 (FTP、SMTP、HTTP、NNTP) 使 用 由 一 个 回 
车 符 后 跟 一 个 换行 符 构 成 的 双 字 符 序列 (CR/LF) 来 分 隔 文本 记录 。 

(2) 显 式 长 度 : 每 个 记录 前 冠 以 它 的 长 度 。 我 们 将 马上 使 用 这 种 技巧 。 
当 用 在 TCP 上 时 ，Sun RPC 也 使 用 这 种 技巧 。 这 种 技巧 的 优势 之 一 是 不 再 
需要 通过 转 义 出 现在 数据 中 的 分 隔 符 ， 因 为 接收 者 不 必 扫 描 整 个 数据 以 寻 
找 每 个 记录 的 结束 位 置 。 

(3) 每 次 连接 一 个 记录 : 应 用 通过 关闭 与 其 对 端的 连接 (网 络 应 用 时 为 
TCP 连 接 ，IPC 应 用 时 为 IPC 连 接 ) 来 指示 一 个 记录 的 结束 。 这 要 求 为 每 个 
记录 创建 一 个 新 连接 ，HTTP 1.0 就 使 用 了 这 一 技术 。 


标准 WO 了 画 数 库 也 能 用 于 读 或 写 一 个 管道 或 FIFO。 上 既然 打 开 一 个 管道 
的 唯一 方法 是 使 用 pipe 函 数 〈 它 返回 的 是 文件 描述 符 ) ， 为 创建 一 个 新 的 
标准 WO 流 (steam) ， 必 须 使 用 标准 WO 函数 fdopen 以 将 该 标准 W/O 流 与 由 
pipe 返 回 的 某 个 已 打开 描述 符 相 关联 。 

也 可 以 构建 更 为 结构 化 的 消息 ， 这 种 能 力 是 由 Posix 消 息 队 列 和 System 
V 消 息 队 列 提供 的 。 我 们 将 看 到 每 个 消息 有 一 个 长 度 和 一 个 优先 级 

(System V 称 后 者 为 “类 型 >) 。 长 度 和 优先 级 是 由 发 送 者 指定 的 ， 消 息 被 

读 出 后 ， 这 两 者 都 返回 给 读 出 者 。 每 个 消息 是 一 个 记录 (record) ， 类 似 
于 UDP 数据 报 (UNPvl) 。 

我 们 也 能 给 一 个 管道 或 FIFO 增 加 些 结构 。 在 图 4-25 所 示 的 mesg.h 头 文 
件 中 ， 我 们 定义 了 一 个 消息 。 


pipemesg/mesg.h 
1 #include "unpipc.h" 


2 /* Our own "messages" to use with pipes, FIFOs, and message queues. */ 


3 /* want sizeof(struct mymesg) «- PIPE BUF */ 
4 #define MAXMESGDATA (PIPE BUF - 2*sizeof (long)) 


5 /* length of mesg len and mesg type */ 
6 #define MESGHDRSIZE (sizeof(struct mymesg) - MAXMESGDATA) 


7 struct mymesg { 


8 long mesg len; /* #bytes in mesg data, can be 0 */ 
9 long mesg type; /* message type, must be > 0 */ 

10 char mesg data [MAXMESGDATA] ; 

Ta Je 


12 ssize t mesg send(int, struct mymesg *); 
13 void Mesg send(int, struct mymesg *); 
14 ssize t mesg recv(int, struct mymesg *); 
15 ssize t Mesg recv(int, struct mymesg *); 
pipemesg/mesg.h 


图 4-25 我 们 的 mymesg 结 构 及 相关 定义 
每 个 消息 有 一 个 mesg_type， 我 们 把 它 定义 成 一 个 值 必须 大 于 0 的 整 
数 。 我 们 现在 暂时 忽略 这 个 类 型 成 员 ， 到 第 6 章 中 讲述 System V 消 息 队列 时 
再 讨论 它 。 每 个 消息 还 有 一 个 长 度 ， 我 们 允许 它 为 0。 我 们 使 用 mymesg 结 
构 在 每 个 消息 前 冠 以 它 的 长 度 ， 而 没有 使 用 换行 符 来 分 隔 消息 。 早 些 时 候 
我 们 提 到 过 这 种 设计 方法 的 两 个 好 处 ， 接 收 者 不必 扫描 所 收 到 的 每 个 字 节 


以 找 出 消息 的 结束 位 置 ， 即 使 分 隔 符 〈 换 行 符 ) 出 现在 消息 中 也 不 必 将 它 


转 义 。 

图 4-26 展 示 了 mymesg 结 构 的 图 示 以 及 我 们 如 何 随 管道 、FIFO 和 System 
ViB IDA FUERIT ° 
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mesg_send 函 数 ， 图 4-28 给 出 了 我 们 的 mesg_recv 函 数 。 


用 作 write 和 read 的 第 二 个 参数 
用 作 msgsnd 和 msgrcv 的 第 二 个 参数 


mesg len — 


System V 消 息 : msgbuf{}， 随 System V 
消息 队列 使 用 ，msgsnda 和 msgrcv 图 数 


我 们 的 消息 : my mesg{}， 随 管道 和 消息 
DAFA, writeMlreadph 2 


图 4-26 我 们 的 mymesg 结 构 
pipemesg/mesg send.c 
1 #include "mesg.h" 
2 ssize t 
3 mesg send(int fd, struct mymesg *mptr) 
& 4 


5 return(write(fd, mptr, MESGHDRSIZE + mptr-»mesg len)); 


6 } 
pipemesg/mesg send.c 


图 4-27 mesg, sendÉR Zi 


pipemesg/mesg recv.c 


1 #include "mesg.h" 

2 ssize t 

3 mesg recv(int fd, struct mymesg *mptr) 

4 f 

5 size t len; 

6 ssize tn; 

7 /* read message header first, to get len of data that follows */ 
8 if ( (n = Read(fd, mptr, MESGHDRSIZE)) == 0) 

9 return(0); /* end of file */ 

10 else if (n !- MESGHDRSIZE) 

Ti err quit("message header: expected $d, got $d", MESGHDRSIZE, n); 
12 if ( (len = mptr-»mesg len) > 0) 

q3 if ( (n = Read(fd, mptr-»mesg data, len)) !- len) 

14 err quit("message data: expected $d, got %d", len, n); 

15 return (len); 

16 } 


ee eld cane 
图 4-28 mesg. recvER Zt 

现在 读 出 每 个 消息 需 调用 两 个 read， 一 个 读 出 消息 长 度 ， 另 一 个 读 出 
真正 的 消息 (如 果 长 度 大 于 0 的 话 ) 。 

细心 的 读者 可 能 注意 到 mesg_recv 会 检查 所 有 可 能 的 错误 是 否 发 生 ， 一 
旦 发 现 则 马上 终止 。 然 而 为 一 致 性 起 见 ， 我 们 还 是 定义 了 一 个 名 为 
Mesg_recv 的 包 囊 函数 ， 并 在 我 们 的 程序 中 调用 它 。 

现在 把 我 们 的 客户 函数 和 服务 器 函数 改 为 使 用 mesg_send 和 mesg_recvV 
函数 。 图 4-29 给 出 了 新 的 客户 函数 。 


pipemesg/client.c 


1 #include "mesg.h" 

2 void 

3 client(int readfd, int writefd) 
41 


5 size t len; 

6 ssize tn; 

7 struct mymesg mesg; 
8 


/* read pathname */ 


9 Fgets(mesg.mesg data, MAXMESGDATA, stdin); 

10 len - strlen(mesg.mesg data); 

TT if (mesg.mesg data[len-1] == '\n') 

12 len--; /* delete newline from fgets() */ 
13 mesg.mesg len - len; 

14 mesg.mesg type - 1; 

15 /* write pathname to IPC channel */ 

16 Mesg send(writefd, &mesg); 

17 /* read from IPC, write to standard output */ 
18 while ( (n = Mesg recv(readfd, &mesg)) > 0) 

19 Write(STDOUT FILENO, mesg.mesg data, n); 

20 } 


pipemesg/client.c 


图 4-29 我 们 的 使 用 消息 的 client 函 数 


读 出 路 径 名 ， 发 送 给 服务 器 

8 一 16 从 标准 输入 读 出 路 径 名 ， 然 后 使 用 mesg_send 将 其 发 送 给 服务 
器 o 

读 出 来 自 服务 器 的 文件 内 容 或 出 错 消息 

177-19 客户 在 一 个 循环 中 调用 mesg_recv， 读 出 服务 器 发 送 回 的 所 有 
东西 。 按 照 约定 ，mesg_recv 返 回 一 个 值 为 0 的 长 度 表 示 已 到 达 来 目 服务 器 
的 数据 的 结尾 。 我 们 将 看 到 服务 器 将 在 发 送 给 客户 的 每 个 消息 中 都 包含 换 
行 待 ， 因 此 衬 行 也 会 有 一 个 值 为 1 的 消息 长 度 。 

图 4-30 给 出 了 新 的 服务 器 函数 。 

从 IPC 通 道 读 出 路 径 名 ， 打 开 文 件 

8 一 18 读 出 来 自 客户 的 路 径 名 。 尽 管 这 儿 给 mesg_type 赋 值 为 1 看 来 无 
用 ( 它 将 被 图 4-28 中 的 mesg_recv 禾 写 ) ， 在 使 用 System V 消 息 队 列 时 (图 
6-10) ， 我 们 仍然 会 调用 本 函数 ， 那 时 是 需要 这 样 的 赋值 的 (例如 图 6- 
13) 。 标 准 WO 画 数 fopen 打 开 该 路 径 名 的 文件 ， 这 与 图 4-10 中 调用 Unix IO 
画 数 open 获 得 访问 该 文件 的 一 个 描述 符 不 一 样 。 这 儿 我 们 调用 标准 WO 函数 


库 的 原因 是 为 了 调用 fgets 逐 行 地 读 出 该 文件 ， 然 后 把 每 一 行 作为 一 个 消息 
发 送 给 客户 。 

将 文件 复制 给 客户 

19--26 如 果 fopen 调 用 成 功 ， 丈 使 用 fgets 读 出 该 文件 并 发 送 给 客户 ， 
每 个 消息 一 行 。 一 个 长 度 为 0 的 消息 表示 已 到 达 文 件 尾 。 

在 使 用 管道 或 FIFO 时 ， 也 可 以 通过 关闭 IPC 通 道 来 通知 对 端 已 到 达 输 
入 文件 的 结尾 。 不 过 我 们 通过 发 送 回 一 个 长 度 为 0 的 消息 来 达到 同样 目 
的 ， 因 为 之 后 还 会 遇 到 没有 文件 结束 符 概 念 的 其 他 类 型 的 IPC © 


pipemesg/server.c 


1 #include "mesg.h" 


2 void 
3 server(int readfd, int writefd) 


5 FILE *fp; 
6 ssize t n; 
à struct mymesg mesg; 


8 /* read pathname from IPC channel */ 

9 mesg.mesg_type = 1; 

10 if ( (n = Mesg recv(readfd, &mesg)) == 0) 

11 err quit("pathname missing"); 

12 mesg.mesg data[n] = '\0'; /* null terminate pathname */ 
13 if ( (fp = fopen(mesg.mesg data, "r")) -- NULL) ( 

14 /* error: must tell client */ 

15 snprintf(mesg.mesg data + n, sizeof(mesg.mesg data) - n, 
16 ": can't open, %s\n", strerror(errno)); 

17 mesg.mesg len - strlen(mesg.mesg data); 

18 Mesg send(writefd, &mesg); 

19 } eise { 

20 /* fopen succeeded: copy file to IPC channel */ 

21 while (Fgets(mesg.mesg data, MAXMESGDATA, fp) != NULL) { 
22 mesg.mesg len = strlen(mesg.mesg data); 

23 Mesg send(writefd, &mesg); 

24 } 

25 Fclose (fp) ; 

26 } 

27 /* send a 0-length message to signify the end */ 

28 mesg.mesg len = 0; 

29 Mesg_send(writefd, &mesg) ; 

30 } 


pipemesg/server.c 


图 4-30 我 们 的 使 用 消息 的 server 范 数 


调用 我 们 的 dient 和 server 函 数 的 main 函 数 根本 不 变 。 我 们 既 可 使 用 管 
道 版 本 (图 4-8) ， 也 可 使 用 FIFO 版 本 (图 4-16) ° 


4.11 管道 和 FIFO 限 制 


系统 加 于 管道 和 FIFO 的 唯一 限制 为 : 

OPEN MAX 一 个 进程 在 任意 时 刻 打开 的 最 大 描述 符 数 (Posix 要 求 至 
少 为 16) ; 

PIPE BUF 可 原子 地 写 往 一 个 管道 或 FIFO 的 最 大 数据 量 (我 们 在 4.7 市 
讲述 过 ，Posix 要 求 至 少 为 512) 。 

我 们 马上 会 看 到 OPEN_MAX 的 值 可 通过 调用 sysconf 函 数 查 询 。 它 通 
常 可 通过 执行 ulimit 命 令 (Bourne shell 或 KornShell ， 我 们 马上 会 看 到 ) 或 
limit 命 令 (C shell) 从 shell 中 修改 。 它 也 可 通过 调用 setrlimit 芳 数 (在 
APUE 的 7.11 节 中 详细 讲述 ) 从 一 个 进程 中 修改 。 

PIPE_BUF 的 值 通 常 定义 在 <limits.h> 头 文件 中 ， 但 是 Posix 认 为 它 是 一 
个 路 径 名 变量 (pathname variable) 。 这 意味 着 它 的 值 可 以 随 所 指定 的 路 径 
名 而 变化 (只 对 FIFO 而 言 ， 因 为 管道 没有 名 字 ) ， 因 为 不 同 的 路 径 名 可 以 
落 在 不 同 的 文件 系统 上 ， 而 这 些 文件 系统 可 能 有 不 同 的 特征 。 于 是 
PIPE_BUF 的 值 可 在 运行 时 通过 调用 pathconf 或 fpathconf 取 得 。 图 4-31 给 
了 输出 这 两 个 限制 值 的 一 个 例子 程序 。 


pipe/pipeconf.c 


1 #include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 
af 
if (argc != 2) 
err quit("usage: pipeconf <pathname>") ; 
printf("PIPE BUF = %ld, OPEN MAX = %ld\n", 


Pathconf(argv[1], PC PIPE BUF), Sysconf( SC OPEN MAX)); 
exit(0); 


ow 0 -1 Ov ul 


) 
pipe/pipeconf.c 


图 4-31 在 运行 时 确定 PIPE_BUF 和 OPEN_MAX 的 值 

下 面 是 一 些 例子 ， 指 定 了 不 同 的 文件 系统 。 

solaris 96 pipeconf / Solaris 2.684 [E 
PIPE BUF = 5120,0PEN MAX = 64 


solaris 96 pipeconf /home 


PIPE BUF = 5120,0PEN MAX = 64 

solaris 96 pipeconf /tmp 

PIPE BUF = 5120,0PEN MAX = 64 

alpha 96 pipeconf / Digital Unix 4.0B 默 认 值 
PIPE BUF = 4096,0PEN MAX = 4096 

alpha 96 pipeconf /usr 

PIPE BUF = 4096,0PEN MAX = 4096 

下 面 给 出 在 Solaris 下 如 何 使 用 KornShell 修 改 OPEN_MAX 的 值 。 


solaris 96 ulimit -nS 输出 最 大 描述 符 数 ， 软 限制 
64 

solaris 96 ulimit -nH 输出 最 大 描述 符 数 ， 硬 限制 

1024 

solaris 96 ulimit -ns 512 设置 软 限制 为 512 

solaris 96 pipeconf / 验证 该 变动 已 发 生 


PIPE BUF = 5120,OPEN_MAX = 512 

尽管 能 够 修改 FIFO 的 PIPE_BUF 的 值 ， 这 取决 于 路 径 名 所 存放 的 底层 
文件 系统 ， 但 实际 应 该 很 少 这 么 做 。 

APUERJ S 23 fi ult f fpathconf ^ pathconfFilsysconfi Zi, ix 2E ER BV E 
供 了 有 关 特 定 内 核 限 制 的 运行 时 信息 。Posix.1 定 义 了 以 _PC_ 开 头 的 12 个 常 
值 和 以 _SC_ 开 头 的 52 个 常 值 。Digital Unix 4.0B 和 Solaris 2.6 都 对 后 者 作 了 
扩充 ， 定 义 了 约 100 个 可 使 用 sysconf 和 查询 的 运行 时 常 值 。 

Posix.2 定 义 了 getconf 命 令 ， 它 可 以 输出 这 些 实现 限制 值 中 的 大 多 数 。 
例如 : 

alpha % getconf OPEN MAX 

4096 

alpha 96 getconf PIPE BUF / 

4096 


4.12 小 结 


管道 和 FIFO 是 许多 应 用 程序 的 基本 构建 模块 。 管 道 普 裔 用 于 shell 中 ， 
不 过 也 可 以 从 程序 中 使 用 ， 往 往 是 用 于 从 子 进 程 向 父 进程 回 传 信 息 。 使 用 
管道 时 涉及 的 某 些 代码 〈pipe、fork、close、exec 和 waitpid) 可 通过 使 用 
popen 和 pclose 来 避免 ， 由 它们 处 理 具 体 细 下 并 激活 一 个 shell 。 

FIFO 与 管道 类 似 ， 但 它们 是 用 mkfifo 创 建 的 ， 之 后 需 用 open 打 开 。 打 
开 管 道 时 必须 小 心 ， 因 为 有 许多 规则 (图 4-21) 制约 着 open 的 阻塞 与 否 。 

在 使 用 管道 和 FIFO 的 前 提 下 ， 我 们 查看 了 一 些 客户 -服务 器 程序 设 
i: 一 个 服务 器 服务 多 个 客户 ， 服 务 器 可 以 是 迭代 的 ， 也 可 以 是 并 发 的 。 
迭代 服务 器 以 串 行 方式 每 次 处 理 一 个 客户 请 求 ， 它 们 易 遭 受 拒绝 服务 型 攻 
击 。 并 发 服务 器 则 证 另外 一 个 进程 或 线程 处 理 每 个 客户 请 求 。 

管道 和 FIFO 的 特征 之 一 是 它们 的 数据 是 一 个 字 节 流 ， 类 似 于 TCP 连 
接 。 把 这 种 字 厄 流 分 隔 成 各 个 记录 的 任何 方法 都 得 由 应 用 程序 来 实现 。 我 
们 将 在 接 下 去 的 两 章 中 看 到 消息 队列 会 提供 记录 边界 ， 类 似 于 UDP 数据 
报 。 


习题 


4.1 在 从 图 4-3 到 图 4-4 的 转换 中 ， 如 果子 进程 没有 执行 close(fd[1])， 那 
么 会 发 生 什 么 情况 ? 

4.2 在 4.6 节 描述 mkfifo 时 ， 我 们 说 过 要 打开 一 个 已 有 的 FIFO 或 创建 一 
个 新 的 FIFO， 应 该 调用 mkfifo， 检 查 是 否 返 回 EEXIST 错 误 ， 若 是 则 调用 
open ° 如果 把 这 个 逻辑 关系 变换 一 下 ， 先 调用 open， 当 不 存在 所 期 望 的 
FIFO 时 再 调用 mkfifo， 那 么 会 发 生 什么 情况 ? 

4.3 在 图 4-15 中 调用 popen 时 ， 如 果 其 中 执行 命令 的 shell 碰 到 错误 ， 那 
么 会 发 生 什么 情况 ? 

4.4 把 图 4-23 中 针对 服务 器 的 FIFO 的 open 去 掉 ， 验 证 一 下 这 将 导致 当 
不 再 有 客户 存在 时 ， 服 务 器 即 终止 。 


4.5 在 图 4-23 中 我 们 指出 ， 当 服务 器 启动 后 ， 它 阻塞 在 目 己 的 第 一 个 
open 调 用 中 ， 直 到 客户 的 第 一 个 open 打 开 同 一 个 FIFO 用 于 写 为 止 。 我 们 怎 
样 才 能 绕 过 这 样 的 阻塞 ， 使 得 两 个 open 都 立即 返回 ， 转 而 阻塞 在 首次 调用 
readline E? 

4.6 如 果 图 4-24 中 的 客户 程序 对 换 其 两 个 open 调 用 的 顺序 ， 那 么 会 发 生 
什么 情况 ? 

4.7 为 什么 在 读 进 程 关 闭 管 道 或 FIFO 之 后 给 写 进 程 产生 一 个 信号 ， 而 

`\ 会 在 写 进程 关闭 管道 或 FIFO 之 后 给 读 进 程 产 生 一 个 信和 号? 

4.8 编写 一 个 小 测试 程序 ， 确 定 fstat 是 否 以 stat 结 构 的 st_size 成 员 的 形式 
返回 当前 在 某 个 FIFO 中 的 数据 字 节 数 。 

4.9 写 一 个 小 测试 程序 ， 以 确定 在 为 一 个 读 出 端 已 关闭 的 管道 摘 述 符 
选择 可 写 条 件 时 select 返 回 的 内 容 。 


第 5 章 Posix 消 息 队 列 


5.1 概述 


消息 队列 可 认为 是 一 个 消息 链表 。 有 足够 写 权 限 的 线程 可 往 队 列 中 放 
置 消息 ， 有 足够 读 权限 的 线程 可 从 队列 中 取 走 消息 。 每 个 消息 都 是 一 个 记 
K (回想 我 们 在 4.10 市 就 字 节 流 和 消息 的 讨论 ， ， 它 由 发 送 者 赋予 一 个 优 
移 级 。 在 某 个 进程 往 一 个 队列 写 入 消息 之 前 ， 并 不 需要 另外 某 个 进程 在 该 
队列 上 等 待 消息 的 到 达 。 这 跟 管道 和 FIFO 是 相反 的 ， 对 后 两 者 来 说 ， 除 非 
读 出 者 已 存在 ， 否 则 先 有 写 入 者 是 没有 意义 的 。 

一 个 进程 可 以 往 某 个 队列 写 入 一 些 消息 ， 然 后 终止 ， 再 让 另外 一 个 进 
程 在 以 后 某 个 时 刻 读 出 这 些 消 息 。 我 们 说 过 消息 队列 具有 随 内 核 的 持续 性 
(1.3 市 ) ， 这 跟 管道 和 FIFO 不 一 样 。 我 们 在 第 4 章 中 说 过 ， 当 一 个 管道 或 
FIFO 的 最 后 一 次 关闭 发 生 时 ， 仍 在 该 管道 或 FIFO 上 的 数据 将 被 丢弃 。 


本 章 讲述 Posix 消 息 队 列 ， 第 6 章 讲述 System VIR BMY! ° 3x WA ZH HEY 
间 存 在 许多 相似 性 ， 下 面 是 主要 的 差别 。 

对 Posix 消 息 队 列 的 读 总 是 返回 最 高 优先 级 的 最 早 消息 ， 对 System VIA 
息 队 列 的 读 则 可 以 返回 任意 指定 优先 级 的 消息 。 

当 往 一 个 空 队列 放 置 一 个 消息 时 ，Posix 消 息 队 列 允 许 产 生 一 个 信号 或 
启动 一 个 线程 ， System V 消 息 队 列 则 不 提供 类 似 机 制 。 

队列 中 的 每 个 消息 具有 如 下 属性 : 

一 个 无 符号 整数 优先 级 (Posix) 或 一 个 长 整数 类 型 (System V) ; 

消息 的 数据 部 分 长 度 (可 以 为 0) ; 

PEAR (如 果 长 度 大 于 0) 

注意 这 些 特征 不 同 于 管道 和 FIFO“。 后 两 者 是 字 和 流 模型 ， 没 有 消息 
界 ， 也 没有 与 每 个 消息 关联 的 类 型 。 我 们 在 4.10 广 就 此 讨论 过 ， 并 给 管 
和 FIFO 增 设 了 自己 的 消息 接口 。 

图 5-1 展 示 了 一 个 消息 队列 的 可 能 布局 。 


3 
道 


下 一 个 消息 


F 一 个 消息 
优先 级 =20 


数据 


优先 级 =10 


mq maxmsg 
mq msgsize 


图 5-1 含有 三 个 消息 的 某 个 Posix 消 息 队 列 的 可 能 布局 
我 们 所 设想 的 是 一 个 链表 ， 该 链表 的 头 中 含有 当前 队列 的 两 个 属性 : 
队列 中 允许 的 最 大 消 轧 数 以 及 每 个 消 妃 的 最 大 大 小 。 我 将 在 5.3 节 中 详细 讨 
论 这 两 个 属性 。 
从 本 章 开 始 我 们 使 用 一 种 新 的 程序 设计 技巧 ， 它 在 以 后 讨论 消息 队 
列 、 信 号 量 和 共享 内 存 区 的 各 章 中 也 会 用 到 。 既 然 所 有 这 些 IPC 对 象 至 少 
具有 随 内 核 的 持续 性 (ERL) ， 于 是 我 们 可 以 编写 若干 小 程序 来 使 用 


这 些 IPC 机 制 ， 以 便 深 入 地 认识 它们 ， 并 深刻 地 了 解 它们 的 操作 。 例 如 ， 
我 们 可 编写 一 个 程序 来 创建 一 个 Posix 消 息 队 列 ， 编 写 另 一 个 程序 来 往 某 个 
Posix 消 筷 队 列 中 加 入 一 个 消息 ， 再 编写 男 一 个 程序 来 从 某 个 Posix 消 乱 队 
列 中 读 出 一 个 消息 。 通 过 以 不 同 的 优先 级 构造 各 个 消息 ， 我 们 可 以 看 出 
mq_receive 函 数 是 怎样 返回 这 些 消 息 的 。 


——— ee P—— 


mg open KAE — THA BU BET 7T — 1 CL EETERTTR I e 

#include <mqueue.h> 

mqd_t mq open(const char *name, int oflag,... 

/* mode t mode,struct mq attr *attr */ ); 
返回 : AROMA BR Fars, E ERUUZS-1 

我 们 已 在 2.2 市 插 述 过 有 关 name 参 数 的 规则 。 

oflag 参 数 是 O_RDONLY、O_WRONLY 或 O_RDWR 之 一 ， 可 能 按 位 或 
上 O_CREAT、O_EXCL 或 OFNONBLOCK。 我 们 已 在 2.3 节 讲述 过 所 有 这 些 
标志 。 

当 实 际 操作 是 创建 一 个 新 队列 时 (已 指定 O_CREAT 标 志 ， 且 所 请 求 的 
消息 队列 尚未 存在 ) , mode 和 attr 参 数 是 需要 的 。 我 们 在 图 2-4 中 给 出 了 
mode 值 。attr 参 数 用 于 给 新 队列 指定 某 些 属性 。 如 果 它 为 空 指针 ， 那 就 使 
用 默认 属性 。 我 们 将 在 5.3 节 讨论 这 些 属性 。 

mq_open 的 返回 值 称 为 消息 队列 描述 符 (mesage queue descriptor) , 
但 它 不 必 是 (而 且 很 可 能 不 是 ) 像 文件 描述 符 或 套 接 字 描述 符 这 样 的 短 整 
数 。 这 个 值 用 作 其 余 7 个 消息 队列 函数 的 第 一 个 参数 。 

Solaris 2.6 把 mqd_t 定 义 为 void* ， 而 Digital Unix 4.0B 把 它 定义 为 int 。 在 
5.8 节 我们 的 Posix 消 息 队 列 实现 例子 中 ， 消 息 队 列 描述 符 是 一 个 结构 指 
针 。 称 这 些 数据 类 型 为 描述 符 是 一 个 不 幸 的 错误 。 

已 打开 的 消息 队列 是 由 mq_close 关 闭 的 。 


#include <mqueue.h> 


int mq close(mqd t mqdes); 
返回 : BAM AO, ABA- 

其 功能 与 关闭 一 个 已 打开 文件 的 close 画 数 类 似 : 调用 进程 可 以 不 再 使 
用 该 描述 符 ， 但 其 消息 队列 并 不 从 系统 中 删除 。 一 个 进程 终止 时 ， 它 的 所 
有 打开 着 的 消息 队列 都 和 关闭， 就 像 调 用 了 mq_close 一 样 。 

要 从 系统 中 删除 用 作 mq_open 第 一 个 参数 的 某 个 name， 必 须 调 用 
mq_unlink ° 

#include <mqueue.h> 

int mq_unlink(const char *name); 

返回 : BAM AO, AEEA- 

每 个 消息 队列 有 一 个 保存 其 当前 打开 着 描述 符 数 的 引用 计数 器 (就 像 
文件 一 样 ) [4] ， 因 而 本 函数 能 够 实现 类 似 于 unlink 函 数 删 除 一 个 文件 的 机 
制 ， 当 一 个 消息 队列 的 引用 计数 仍 大 于 0 时 ， 其 name 束 能 删除 ， 但 是 该 队 
列 的 析 构 (这 与 从 系统 中 删除 其 名 字 不 同 ) 要 到 最 后 一 个 mq_close 发 生 时 
下 

Posix 消 息 队 列 至 少 具 备 随 内 核 的 持续 性 《回想 1.3 节 ) 。 这 就 是 说 ， 
即使 当前 没有 进程 打开 着 某 个 消 恩 队列 ， 该 队列 及 其 上 的 各 个 消息 也 将 一 
直 存 在 ， 直 到 调用 mq_unlink 并 让 它 的 引用 计数 达到 0 以 删除 该 队列 为 止 。 

我 们 将 看 到 ， 如 采 消 息 队 列 是 使 用 内 存 映射 文件 (12.27) 实现 的 ， 
那么 它们 具有 随 文件 系统 的 持续 性 ， 但 这 不 是 必需 的 ， 因 而 不 能 指望 。 

5.2.1 例子 : mqcreatel 程 序 

既然 Posix 消 息 队 列 至 少 具 有 随 内 核 的 持续 性 ， 我 们 于 是 可 以 编写 一 组 
小 程序 来 操纵 这 些 队 列 ， 以 提供 认 知 它们 的 简易 办 法 。 图 5-2 中 的 程序 创建 
一 个 消息 队列 ， 其 名 字 是 作为 命令 行 参数 指定 的 。 


pxmsg/mqcreatel.c 


1 #include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 


5 int c, flags; 

6 mqd t mqd; 

7 flags - O RDWR | O CREAT; 

8 while ( (c = Getopt(argc, argv, "e")) !- -1) ( 
9 switch (c) ( 

10 case 'e': 

ii flags |- O EXCL; 

12 break; 

13 ) 

14 ) 

15 if (optind != argc - 1) 

16 err quit("usage: mqcreate [ -e ] «name»"); 
17 mqd = Mq open(argv[optind], flags, FILE MODE, NULL); 
18 Mq close (mqd) ; 

19 exit(0); 


pxmsg/mqcreatel.c 


到 5-2 指定 排他 性 创建 标志 ， 创 建 一 个 消息 队列 

8 一 16 我 们 允许 有 一 个 指定 排他 性 创建 的 -e 选 项 。 (KF getopt žit 
它 的 Getopt 包 囊 画 数 ， 我 们 将 随 图 5-5 详 细 讨 论 。) 返回 时 ，getopt 在 optind 
中 存放 下 一 个 待 处 理 参 数 的 下 标 。 

17 直接 以 来 目 命 令 行 的 IPC 名 字 调 用 mq_open ， 而 不 去 调用 
px ipc nameE«Z (2.277) 。 这 样 我 们 就 能 准确 地 看 出 实现 是 如 何 处 理 这 
些 Posix IPC 名 字 的 。 (本 书 中 的 所 有 简单 测试 程序 都 这 么 处 理 。) 

下 面 是 在 Solaris 2.6 下 的 输出 。 


solaris 96 mqcreate1 /temp.1234 第 一 次 创建 成 功 

-TW-TW-TW- 1 rstevens other1 132632 Oct 23 17:08 
/tmp/.MQDtemp.1234 

-TW-IW-Iw- 1 rstevens other1 0 Oct 23 17:08 
/tmp/.MQLtemp.1234 

-IW-r--r-- 1 rstevens other1 0 Oct 23 17:08 
/tmp/.MQPtemp.1234 

solaris 96 mqcreate1 -e /temp.1234 指定 -e 选 项 的 第 二 次 创建 


失败 


solaris 96 ls -l /tmp/.*1234 
mq open error for /temp.1234: File exists 
(我 们 称 这 个 程序 为 mqcreatel， 因 为 它 将 在 我 们 说 明 属 性 后 ， 在 图 5-5 

中 得 以 改进 。) 第 三 个 文件 (/temp.MQPtemp.1234) 具有 我 们 用 
FILE_MODE 常 值 (用 户 可 读 可 写 ， 组 成 员 和 其 他 用 户 只 读 ) 指定 的 权 
限 ， 男 外 两 个 文件 的 权限 则 不 一 样 。 我 们 猜测 文件 名 中 含有 DD 的 文件 含有 
数据 ， 含 有 L 的 文件 是 某 种 类 型 的 锁 ， 含 有 P 的 文件 指定 权限 。 

在 Digital Unix 4.0B 下 ， 我 们 可 看 到 所 创建 的 是 真正 的 路 径 名 。 

alpha % mqcreate1 /tmp/myq.1234 


alpha 96 ls -l /tmp/myq.1234 

-IW-r--r-- 1 rstevens system 11976 Oct 23 17:04 /tmp/myq.1234 
alpha 96 mqcreate1 -e /tmp/myq.1234 

mq open error for /tmp/myq.1234: File exists 

5.2.2 例子 : mqunlink 程 序 

图 5-3 中 的 mqunlink 程 序 从 系统 中 删除 一 个 消息 队列 。 


pxmsg/mqunlink.c 


1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
4 { 
if (argc != 2) 
err quit ("usage: mqunlink <name>"); 
Mq_unlink (argv [1]) ; 


exit (0); 


oo IN AW 


pxmsg/mqunlink.c 


图 5-3 mq_unlink 一 个 消息 队列 


我 们 可 使 用 该 程序 删除 由 mqcreate 程 序 创建 的 消息 队列 。 
solaris % mqunlink /temp.1234 


我 们 早先 给 出 的 /tmp 目 录 下 的 所 有 三 个 文件 都 被 删除 了 。 
5.3 mq_getattr 和 mq setattr HA 


BNA ADSI UU JE TE, mq getattoi E Pr xS ES TE, mq. setattr 
则 设置 其 中 某 个 属性 。 

#include <mqueue.h> 

int mq_getattr(mqd_t mqdes, struct mq attr *attr); 

int mq_setattr(mqd_t mqdes,const struct mq attr *attrstruct mq attr 
*oattr); 

均 返 回 : BRM AO, Æ HENA- 
mq_attr 结 构 含有 以 下 属性 。 
struct mq_attr { 
long mq flags; /* message queue flag: 0,0_ NONBLOCK */ 


long mq maxmsg; /* max number of messages allowed on queue */ 


long mq msgsize; /* max size of a message (in bytes)*/ 
long mq curmsgs; /* number of messages currently on queue */ 
h 
指 癌 某 个 mq_attr 结 构 的 指针 可 作为 mq_open 的 第 四 个 参数 传递 ， 从 而 
允许 我 们 在 该 函数 的 实际 操作 是 创建 一 个 新 队列 时 ， 给 它 指 定 mq_maxmsg 
和 mq_msgsize 属 性 。mq_open 名 上 略 该 结构 的 另外 两 个 成 员 。 
mq_getattr 把 所 指定 队列 的 当前 属性 填 入 由 attr 指 向 的 结构 。 
mq_setattr 给 所 指定 队列 设置 属性 ， 但 是 只 使 用 由 attr 指 向 的 mq_attr 结 
构 的 mq_flags 成 员 ， 以 设置 或 请 除非 阻塞 标志 。 该 结构 的 另外 三 个 成 员 被 
忽略 : 每 个 队列 的 最 大 消息 数 和 每 个 消息 的 最 大 字 区 数 只 能 在 创建 队列 时 
设置 ， 队 列 中 的 当前 消息 数 则 只 能 获取 而 不 能 设置 。 
另外 ， 如 果 oattr 指 针 非 空 ， 那 么 所 指定 队列 的 先前 属性 (mq flags ` 
mq_maxmsg#llmq_msgsize) 和 当前 状态 (mq curmsgs) 将 返回 到 由 该 指针 
指向 的 结构 中 。 
5.3.1 例子 : mqgetattr 程 序 
图 5-4 中 的 程序 打开 一 个 指定 的 消息 队列 ， 并 输出 其 属性 。 


pxmsg/mqgetattr.c 


1 include "unpipc.h" 


2 dnt 


3 main(int argc, char **argv) 


mgd t mqd; 
struct mq attr attr; 


if (argo 12:2) 
err quit("usage: mggetattr <name>"); 


mqd = Mq open(argv[1], O RDONLY); 


Mq getattr(mgd, &attr); 

printf ("max #msgs = $1d, max #bytes/msg = $1d, " 
"#currently on queue = %ld\n", 
attr.mq maxmsg, attr.mq msgsize, attr.mq_curmsgs) ; 


Mq close (mqd) ; 
exit(0); 


pxmsg/mqgetattr.c 


图 5-4 取得 并 输出 某 个 消息 队列 的 属性 


我 们 可 以 创建 一 个 消息 队列 并 输出 其 默认 属性 。 
solaris 96 mqcreate1 /hello.world 
solaris % mggetattr /hello.world 


max #msgs = 128,max #bytes/msg = 1024,#currently on queue = 0 


现在 可 以 看 出 ， 在 图 5-2 之 后 以 默认 属性 创建 一 个 队列 的 例子 中 ， 由 ls 


列 出 的 数据 文件 (/tmp/.MQDtemp.1234) 的 大 小 为 128x1024+1560=132 
632。1560 个 额外 字 节 也 许 是 开销 信息 : 每 个 消息 8 字 节 ， 外 加 另外 536 个 


5.3.2 例子 : mqcreate 程 序 
我 们 可 以 对 图 5-2 中 的 程序 作 修 改 ， 以 允许 指定 所 创建 队列 的 最 大 消息 


数 和 每 个 消 轧 的 最 大 大 小 。 我 们 不 能 只 指定 其 中 一 个 而 不 指定 另 一 个 ， 即 


两 者 都 得 指定 (不 过 见习 题 5.1) 。 图 5-5 是 修改 后 的 程序 。 


pxmsg/mqcreate.c 


1 #include "unpipc.h" 

2 struct mq attr attr; /* mq maxmsg and mq msgsize both init to 0 */ 
3 int 

4 main(int argc, char **argv) 

5 { 

6 int c, flags; 

7 mqd t mqd; 

8 flags - O RDWR | O CREAT; 

9 while ( (c = Getopt(argc, argv, "em:z:")) !- -1) { 
10 switch (c) ( 
IX case 'e': 
12 flags |- O EXCL; 
13 break; 

14 case 'm': 
£5 attr.mq_maxmsg = atol (optarg) ; 
16 break; 

17 case 'z': 

18 attr.mq_msgsize = atol(optarg); 

19 break; 
20 } 
21 } 
22 if (optind != argc - 1) 
23 err quit("usage: mqcreate [ -e ] [ -m maxmsg -z msgsize ] <name>"); 
24 if ((attr.mq maxmsg !- 0 && attr.mq msgsize -- O) || 
25 (attr.mq maxmsg == 0 && attr.mq msgsize !- 0)) 
26 err quit("must specify both -m maxmsg and -z msgsize"); 
23 mqd = Mq open(argv[optind], flags, FILE MODE, 

28 (attr.mq maxmsg !- 0) ? &attr : NULL); 
29 Mq close (mqd) ; 

30 exit (0); 

31 } 


pxmsg/mqcreate.c 


图 5-5 改进 后 的 图 5-2， 人 允许 指定 属性 
指定 某 个 命令 行 选项 需要 一 个 参数 ， 我 们 在 getopt 调 用 中 给 这 些 选 项 
(m 和 z) 指定 了 一 个 后 跟 的 冒号 。 在 处 理 这 样 的 选项 字符 时 ，optarg 


我 们 的 Getopt 包 囊 函 数 调用 标准 函数 库 中 的 getopt 函 数 ， 并 在 getopt 检 
测 到 错误 时 终止 当前 进程 ， 这 些 错误 包括 : 人 过 到 一 个 没有 包含 在 getopt 第 
三 个 参数 中 的 选项 字母 ， 或 者 遇 到 一 个 没有 所 需 参 数 的 选项 字母 (通过 在 
getopt 的 第 三 个 参数 中 的 该 选项 字母 之 后 跟 一 个 冒号 指示 ) 。 不 论 遇 到 哪 
种 错误 ，getopt 都 将 一 个 出 错 消 息 写 到 标准 错误 得 出， 然后 返回 一 个 错 


误 ， 这 个 错误 导致 我 们 的 Getopt 包 右 函 数 终止 。 例 如 ， 如 下 两 个 错误 由 
getopt 检 测 出 。 

solaris 96 mqcreate -z 

mqcreate: option requires an argument -- z solaris 96 mqcreate -q 

mqcreate: illegal option -- q 

下 面 这 个 错误 (没有 指定 所 需 的 名 字 参 数 ) 则 由 我 们 的 程序 检测 出 。 


solaris 96 mqcreate 


usage: mqcreate [ -e | [ -m maxmsg -z msgsize ] <name> 

如 果 这 两 个 新 的 命令 行 选项 都 没有 指定 ， 我 们 就 给 mq_open 传 递 一 个 
空 指针 作为 最 后 一 个 参数 ， 否 则 传递 一 个 根据 所 指定 命令 行 选项 的 参数 构 
造 的 attr 结 构 。 

现在 运行 这 个 新 版 本 的 程序 ， 指 定 一 个 最 多 有 1024 个 消息 的 队列 ， 
个 消息 最 多 有 8192 个 字 节 。 

solaris % mqcreate -e -m 1024 -z 8192 /foobar 

solaris 96 ls -al /tmp/.*foobar 

-IW-rw-rw- 1 rstevens other1 8397336 Oct 25 11:29 /tmp/.MQDfoobar 

-rw-rw-rw-  irstevens other1 0 Oct 25 11:29 /tmp/.MQLfoobar 

-rw-r--r-- 1 rstevens other1 0 Oct 25 11:29 /tmp/.MQPfoobar 

含有 该 队列 之 数据 的 文件 Utmp/.MQDfoobar) 其 大 小 能 容纳 最 大 数目 
的 最 长 消息 (1024x 8192- 8 388 608) ， 剩 余 的 8728 字 节 开 销 人 允许 每 个 消 
息 占 用 8 个 字 节 (8x1024-8192) , 5536 T FT - 

在 Digital Unix 4.0B 下 执行 同一 程序 的 结果 如 下 : 

alpha 96 mqcreate -m 256 -z 2048 /tmp/bigq 


alpha 96 Is -l /tmp/bigq 

-rw-r--r-- 1 rstevens system 537288 Oct 25 15:38 /tmp/bigq 

该 系统 上 的 实现 看 来 能 容纳 最 大 数目 的 最 长 消息 (256x2048=524 
288) ， 剩 余 的 13 000 字 节 开 销 允 许 每 个 消息 占用 48 个 字 节 (48x256 = 12 
288) ， 外 加 712 个 字 节 。 


5.4 mq_send#ilmq_receive Hat 


这 两 个 函数 分 别 用 于 往 一 个 队列 中 放置 一 个 消息 和 从 一 个 队列 中 取 走 
一 个 消息 。 每 个 消息 有 一 个 优先 级 ， 它 是 一 个 小 于 MQ_PRIO_MAX 的 无 符 
号 整数 。Posix 要 求 这 个 上 限 至 少 为 32。 

Solaris 2.6 的 上 限 为 32，Digital Unix 4.0B 的 上 限 为 256。 我 们 将 随 图 5-8 
给 出 取得 该 上 限 值 的 方法 。 

mq_receive 总 是 返回 所 指定 队列 中 最 高 优先 级 的 最 早 消 息 ， 而 且 该 优 
先 级 能 随 该 消息 的 内 容 及 其 长 度 一 同 返 回 。 

mq_receive 的 操作 不 同 于 Systme V 的 msgrcv (6.477) ° System VIE 
有 一 个 类 似 于 优先 级 的 类 型 字段 ， 但 使 用 msgrcv 时 ， 我 们 可 以 就 返回 哪 一 
个 消息 指定 三 种 不 同 的 情形 : 所 指定 队列 中 最 早 的 消息 、 具 有 某 个 特定 类 
型 的 最 早 消息 、 其 类 型 小 于 或 等 于 某 个 值 的 最 早 消息 。 


#include <mqueue.h> 


int mq send(mqd t mqdes,const char *ptr,size_t len,unsigned int prio); 

返回 : ERKI, AEEA- 

ssize t mq receive(mqd t mqdes,char *ptr,size_t len,unsigned int *priop); 

返回 : BRO RPS a, AEEA- 

这 两 个 函数 的 前 三 个 参数 分 别 与 write 和 read 的 前 三 个 参数 类 似 。 

把 指向 缓冲 区 的 指针 参数 定义 为 char* 看 来 是 个 错误 。 使 用 void* 将 与 
其 他 Posix.1 函 数 更 为 一 致 。 

mq_receive 的 len 参 数 的 值 不 能 小 于 能 加 到 所 指定 队列 中 的 消息 的 最 大 
大 小 (该 队列 mq_attr 结 构 的 mq_msgsize 成 员 ) 。 要 是 len 小 于 该 值 ， 
mdq_receive 就 立即 返回 EMSGSIZE 错 误 。 

这 意味 着 使 用 Posix 消 息 队 列 的 大 多 数 应 用 程序 必须 在 打开 某 个 队列 后 
调用 mq_getattr 确 定 最 大 消息 大 小 ， 然 后 分 配 一 个 或 多 个 那样 大 小 的 读 缓冲 
区 。 通 过 要 求 每 个 缓冲 区 总 是 足以 存放 队列 中 的 任意 消 忌 ，mq_receive 就 
不 必 返 回 消息 是 否 大 于 缓冲 区 的 通知 。 作 为 比较 的 例子 ，System V 消 息 队 


J| (6.4 节 ) 可 能 使 用 MSG_NOERROR 标 志 ， 返 回 E2BIG 错 误 ， 接 收 UDP 
数据 报 的 recvmsg 函 数 (UNPvl 的 13.5 节 ) 可 能 使 用 MSG_TRUNC 标 志 。 

mq send 的 prio 参数 是 竺 发送 消息 的 优先 级 ， 其 值 必须 小 于 
MQ_PRIO_MAX。 如 果 mq_receive 的 priop 参 数 是 一 个 非 空 指针 ， 所 返回 消 
息 的 优先 级 就 通过 该 指针 存放 。 如 果 应 用 不 必 使 用 优先 级 不 同 的 消息 ， 那 
就 给 mq_send 指 定 值 为 0 的 优先 级 ， 给 mq_receive 指 定 一 个 空 指 针 作 为 其 最 
后 一 个 参数 。 

0 字 节 长 度 的 消息 是 允许 的 。 这 里 重要 的 不 是 标准 ( 即 Posix.1) 中 说 
的 内 容 ， 而 是 它 的 言 外 之 意 : 没有 地 方 可 以 禁止 使 用 0 字 节 长 度 的 消息 。 
mq_receive 的 返回 值 是 所 接收 消息 中 的 字 节 数 (如 果 成 功 ) 或 -1 (如 果 出 
错 ) ， 因 此 返回 值 为 0 表示 返回 长 度 为 0 的 消息 。 

Posix 消 息 队 列 和 System V 消 息 队 列 都 不 具备 的 一 个 特性 是 : 向 接收 者 
准确 地 标识 每 条 消息 的 发 送 者 。 这 个 信息 在 许多 应 用 中 可 能 有 用 。 不 要 的 
是 ， 大 多 数 IPC 消 息 机 制 并 不 标识 发 送 者 。 在 15.5 节 中 ， 我 们 将 讲述 门 如 何 
提供 这 个 标识 。UNPvl 的 14.8 区 讲述 了 使 用 Unix 域 套 接 字 时 ，BSD/OS 如 何 
提供 这 个 标识 。APUE 的 15.3.1 节 [6] 讲述 了 通过 管道 传递 描述 符 时 ，SVR4 
如 何 通过 同一 管道 传递 发 送 者 的 标识 。BSD/OS 技 术 没 有 得 到 广泛 实现 ， 
而 SVR4 技 术 尽 管 是 Unix 98 的 一 部 分 ， 却 要 求 通过 管道 传递 描述 符 ， 这 通 
常 比 通过 管道 直接 传递 数据 开销 更 大 。 我 们 不 能 让 发 送 者 随 消息 包含 自己 
的 标识 〈 例 如 有 效用 户 ID) ， 因 为 难以 认定 发 送 者 不 说 假 话 。 尽 管 消息 队 
列 的 访问 权限 决定 了 是 否 允 许 发 送 者 往 队 列 中 放置 消息 ， 这 仍然 没有 标识 
发 送 者 。 另 外 ， 尽 管 存在 为 每 个 发 送 者 创建 一 个 队列 的 可 能 性 (对 此 我 们 
将 在 6.8 节 就 System V 消 息 队 列 展 开 讨 论 ) ， 但 对 于 大 的 应 用 来 说 ， 这 种 方 
法 的 可 扩展 性 并 不 好 。 最 后 ， 要 是 消息 队列 函数 完全 是 作为 用 户 函 数 实现 
Hy 《5.8 世 中 的 实现 就 是 这 样 ) ， 根 本 没 在 内 核 中 ， 那 么 我 们 不 能 信任 伴随 
消息 的 任何 发 送 者 标识 ， 因 为 它 很 容易 伪造 。 

5.4.1 例子 : mqsend 程 序 

图 5-6 给 出 了 往 某 个 队列 中 增加 一 个 消息 的 mqsend 程 序 。 


1 #include "unpipc.h" 


2 int 


3 main(int argc, char **argv) 


E 


pxmsg/mqsend.c 


5 mqd t mqd; 
6 void *ptr; 
7 size t len; 
8 uint t prio; 
图 5-6 mqsendf£ FF 
9 if (argc != 4) 
10 err quit("usage: mqsend <name> <#bytes> <priority>") ; 
11 len = atoi(argv[21); 
12 prio = atoi (argv[3]); 
13 mqd = Mq open(argv[1], O WRONLY); 
14 ptr - Calloc(len, sizeof(char)); 
15 Mq send(mgd, ptr, len, prio); 
16 exit (0); 
17 } 


图 5-6 (4) 


行 发 送 消息 的 大 小 和 优先 级 必须 作为 命令 行 参数 指定 
用 calloc 分 配 ， 该 贸 数 会 把 该 缓冲 区 初始 化 为 0。 

5.4.2 例子 : mqreceive 程 序 

图 5-7 中 的 程序 从 某 个 队列 中 读 入 下 一 个 消息 。 


pxmsg/mqsend.c 


。 所 用 缓冲 区 使 


pxmsg/mqreceive.c 


1 #include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 


5 int G; flags; 

6 mqd t mqd; 

7 ssize tn; 

8 uint t prio; 

9 void *buff; 

10 struct mq attr attr; 

LL flags - O RDONLY; 

12 while ( (c = Getopt(argc, argv, "n")) != -1) { 
13 switch (c) ( 

14 case 'n': 

15 flags |= O NONBLOCK; 

16 break; 

17 ) 

18 

19 if (optind !- argc - 1) 

20 err quit("usage: mqreceive [ -n ] <name>"); 
21 mqd = Mq open(argv[optind], flags); 

22 Mq getattr (mqd, &attr); 

23 buff - Malloc(attr.mq msgsize); 

24 n = Mq receive(mgd, buff, attr.mq msgsize, &prio); 
25 printf("read $1d bytes, priority = %u\n", (long) n, prio); 
26 exit(0); 

29 0 


pxmsg/mqreceive.c 


图 5-7 mqreceive 程 序 

允许 -n 选 项 以 指定 非 阻塞 属性 

147-17 命令 行 选项 -n 指 定 非 阻塞 属性 ， 这 样 如 果 所 指定 队列 中 没有 消 
已 ，mgqreceive 程 序 就 返回 一 个 错误 。 

打开 队列 并 取得 属性 

21~25 调用 mq_getattr 打 开 队 列 并 取得 属性 。 我 们 需要 确定 最 大 消息 
大 小 ， 因 为 必须 为 调用 mq_receive 分 配 一 个 这 样 大 小 的 缓冲 区 。 最 后 输出 
所 读 出 消息 的 大 小 及 其 属性 

既然 是 一 个 size_t 数 据 类 型 ， 而 我 们 又 不 知道 size_t 是 int Jib 
么 要 使 用 %1d 格 式 化 串 将 n 类 型 强制 转换 成 一 个 长 整数 。 在 64 位 系统 
是 32 位 整数 ，long 和 和 size_t 则 都 是 64 位 整数 。 

我 们 可 使 用 这 两 个 程序 来 查看 优先 级 字段 是 如 何 使 用 的 。 

solaris % mqcreate /test1 创建 并 取得 属性 


HE 


HJ: 


solaris 96 mqgetattr /test1 


max #msgs = 128,max #bytes/msg = 1024,#currently on queue = 0 


solaris 96 mqsend /test1 100 99999 以 无 效 的 优先 级 发 送 

mq send error: Invalid argument 

solaris 96 mqsend /test1 100 6 100 字 市 ， 优 先 级 为 6 
solaris % mqsend /test1 50 18 50 字 市 ， 优 先 级 为 18 
solaris % mqsend /test1 33 18 50 字 市 ， 优 先 级 为 18 
solaris 96 mqreceive /test1 

read 50 bytes,priority — 18 返回 优先 级 最 高 的 最 早 消 


solaris 96 mqreceive /test1 
read 33 bytes,priority = 18 
solaris 96 mqreceive /test1 
read 100 bytes,priority = 6 
solaris % mqreceive-n /test1 指定 非 阻 塞 属性 ， 队 列 为 


mq receive error: Resource temporarily unavailable 


可 以 看 出 ，mq_receive 返 回 优先 级 最 高 的 最 早 消 息 。 
5.5 消息 队列 限制 
我 们 已 遇 到 任意 给 定 队列 的 两 个 限制 ， 它 们 都 是 在 创建 该 队列 时 建立 


mq mqxmsg 队列 中 的 最 大 消息 数 ; 
mq msgsize EKRANE FTR o 
这 两 个 值 都 没有 内 在 的 限制 ， 尽 管 对 于 我 们 已 查看 过 的 两 种 实现 


(Solaris 2.6 和 Digital Unix 4.0B) 来 说 ， 大 小 为 这 两 个 数 之 积 再 加 少量 开 
销 的 某 个 文件 在 文件 系统 中 必须 有 容纳 空间 。 基 于 队列 大 小 的 虚拟 内 存 要 
求 也 可 能 存在 (见习 题 5.5) 。 


消息 队列 的 实现 定义 了 另外 两 个 限制 ; 

MQ OPEN MAX 一 个 进程 能 够 同时 拥有 的 打开 着 消息 队列 的 最 大 数 
H 《Posix 要 求 它 至 少 为 8) ; 

MQ PRIO MAX 任意 消息 的 最 大 优先 级 值 加 1 〈Posix 要 求 它 至 少 为 
a2) = 

这 两 个 常 值 往往 定义 在 <unistd.h> 头 文件 中 ， 也 可 以 在 运行 时 通过 调用 
sysconf 芳 数 获 取 ， 如 接 下 来 的 例子 所 示 。 

例子 : mqsysconf 程 序 

图 5-8 中 的 程序 调用 sysconf， 输 出 消息 队列 的 两 个 由 实现 定义 的 限制 。 


pxmsg/mqsysconf.c 


1 #include "unpipc.h" 


2 ant 
3 main(int argc, char **argv) 


心 


printf("MQ OPEN MAX = $1d, MO PRIO MAX = %ld\n", 
Sysconf( SC MQ OPEN MAX), Sysconf( SC MQ PRIO MAX)); 
exit(0); 


0o -10| Ul 


pxmsg/mqsysconf.c 


图 5-8 调用 sysconf 获 取消 息 队 列 限 制 
在 我 们 的 两 个 系统 上 执行 该 程序 的 结果 如 下 : 
solaris % mqsysconf 

MQ OPEN MAX = 32,MQ PRIO MAX = 32 
alpha 96 mqsysconf 

MQ OPEN MAX = 64,MQ PRIO MAX = 256 


5.6 mq notify Hat 


第 6 章 中 讨论 的 System V 消 息 队 列 的 问题 之 一 是 无 法 通知 一 个 进程 何 时 
在 某 个 队列 中 放置 了 一 个 消息 。 我 们 可 以 阻塞 在 msgrcv 调 用 中 ， 但 那 将 阻 
止 我 们 在 等 待 期 间 做 其 他 任何 事 。 如 有 果 给 msgrcv 指 定 非 阻塞 标志 
(IPC NOWAIT) ， 那 么 尽管 不 阻塞 了 ， 但 必须 持续 调用 该 函数 以 确定 何 
时 有 一 个 消息 到 达 。 我 们 说 过 这 称 为 轮 询 (polling) ， 是 对 CPU 时 间 的 一 


种 浪费 。 我 们 需要 一 种 方法 ， 让 系统 告诉 我 们 何 时 有 一 个 消息 放置 到 了 移 
前 为 空 的 某 个 队列 中 。 

本 节 和 本 划 的 剩余 各 市 含有 高 级 主题 ， 你 第 一 次 阅读 时 可 暂时 跳 过 
去 o 

Posix 消 息 队 列 允 许 异 步 事件 通知 (asynchronous event notification) ， 
以 告知 何 时 有 一 个 消息 放置 到 了 某 个 空 消 息 队 列 中 。 这 种 通知 有 两 种 方式 
可 供 选 择 : 

产生 一 个 信和 号 ; 

创建 一 个 线程 来 执行 一 个 指定 的 函数 。 

这 种 通知 通过 调用 mq_notify 建 立 。 


#include <mqueue.h> 


int mq notify(mqd t mqdes, const struct sigevent *notification); 
返回 : ERKI, AEEA- 
AKAA TR XE BA PR HH RS PAL ° sigeventzii 4 = BSPosix.1 
实时 信号 新 加 的 ， 后 者 将 在 下 一 节 详 细 讨 论 。 该 结构 以 及 本 章 中 引入 的 所 
有 新 的 信号 相关 常 值 都 定义 在 <signal.h> 头 文件 中 。 


union sigval { 


int sival_int; /* integer value */ 
void *sival ptr; /* pointer value */ 


};struct sigevent { 


int sigev_notify; p 
SIGEV_{NONE,SIGNAL,THREAD} */ 
int sigev signo; /* signal number if 


SIGEV. SIGNAL */ 
union sigval sigev. value; /* passed to signal handler or thread */ 
/* following two if SIGEV THREAD */ 
void (*sigev. notify function)(union sigval); 


pthread attr t *sigev notify attributes; 


} 
我 们 马上 给 出 以 不 同方 法 使 用 异步 事件 通知 的 几 个 例子 ， 但 在 此 前 先 
给 出 一 些 普遍 适用 于 该 函数 的 若干 规则 。 

(1) 如 果 notification 参 数 非 空 ， 那 么 当前 进程 希望 在 有 一 个 消息 到 达 所 
指定 的 先前 为 至 的 队列 时 得 到 通知 。 我 们 说 “该 进程 被 注册 为 接收 该 队列 
的 通知 ”。 

(2) 如 果 notification 参 数 为 空 指 针 ， 而 且 当 前 进程 目前 被 注册 为 接收 所 
指定 队列 的 通知 ， 那 么 已 存在 的 注册 将 被 撤销 。 

(3) 任 意 时 刻 只 有 一 个 进程 可 以 被 注册 为 接收 某 个 给 定 队 列 的 通知 。 

(4) 当 有 一 个 消息 到 达 某 个 先前 为 空 的 队列 ， 而 且 已 有 一 个 进程 被 注册 
为 接收 该 队列 的 通知 时 ， 只 有 在 没有 任何 线程 阻塞 在 该 队列 的 mq_receive 
调用 中 的 前 提 下 ， 通 知 才 会 发 出 。 这 就 是 说 ， 在 mq_reveive 调 用 中 的 阻塞 
比 任何 通知 的 注册 都 优先 。 

(5) 当 该 通知 被 发 送 给 它 的 注册 进程 时 ， 其 注册 即 被 撤销 。 该 进程 必须 
再 次 调用 mq_notify 以 重新 注册 (如 果 想 要 的 话 ) 。 

Unix 信 号 最 初 的 问题 之 一 是 : 每 当 一 个 信号 产生 后 ， 其 行为 就 被 复位 
成 默认 行为 (APUE 的 10.4 市 ) 。 信 号 处 理 程序 调用 的 第 一 个 函数 通常 是 
signal， 用 于 重新 建立 处 理 程序 。 这 么 一 来 提供 了 一 个 短 的 时 间 窗 口 ， 它 处 
于 该 信和 号 的 产生 与 当前 进程 重建 其 信号 处 理 程序 之 间 ， 这 上 段 时 间 内 再 次 产 
生 的 同一 信号 可 能 终止 当前 进程 。 初 看 起 来 ，mq_notify 似 乎 有 类 似 的 问 
题 ， 因 为 当前 进程 必须 在 每 次 通知 发 生 后 重新 注册 。 然 而 消息 队列 不 同 于 
言 写 ， 因 为 在 队列 变 空前 通知 不 会 再 次 发 生 。 因 此 我 们 必须 小 心 ， 保 证 在 
从 队列 中 读 出 消息 之 前 (而 不 是 之 后 ) 重新 注册 。 

5.6.1 例子 : 简单 的 信号 通知 

在 深入 探讨 Posix 实 时 信号 和 线程 之 前 ， 我 们 可 以 编写 一 个 简单 的 程 
序 ， 当 有 一 个 消息 放置 到 某 个 空 队 列 中 ， 该 程序 产生 一 个 SIGUSR1 信 号 。 
图 5-9 给 出 了 这 个 程序 ， 注 意 它 含有 一 个 我 们 不 久 后 将 详细 讨论 的 错误 。 

声明 全 局 变量 


2~6 声明 main 函 数 和 信号 处 理 程序 (sig usrl) 都 使 用 的 一 些 全 局 变 
He 

打开 队列 ， 取 得 属性 ， 分 配 读 缓冲 区 

12~15 打开 通过 命令 行 参数 指定 的 消息 队列 ， 获 取 其 属性 ， 然 后 分 配 
一 个 读 缓冲 区 。 

建立 信号 处 理 程序 ， 启 用 通知 

16~ 20 首先 给 SIGUSR1 建 立信 号 处 理 程序 。 在 sigevent 结 构 的 
sigev_notify 成 员 中 填 入 SIGEV_SIGNAL 常 值 ， 其 意思 是 当 所 指定 队列 由 空 
变 为 非 空 时 ， 我 们 希望 有 一 个 信号 会 产生 。 将 sigev_signo 成 员 设 置 成 希望 
产生 的 信号 后 ， 调 用 mq_notify 。 

无 限 循 环 

21~22 main 函 数 接 下 来 是 个 无 限 睡 眠 在 pause 函 数 中 的 循环 ， 该 本 数 
每 次 捕获 一 个 信号 时 都 会 返回 -1。 

捕获 信号 ， 读 出 消息 

25~33 我 们 的 信号 处 理 程序 调用 mq_notify 以 便 为 下 一 个 事件 重新 注 
册 ， 然 后 读 出 消息 并 输出 其 长 度 。 本 程序 中 我 们 忽略 了 接收 到 的 消息 的 优 
先 级 。 


pxmsg/mqnotifysig l.c 


#include "unpipc.h" 


mqd t mqd; 
void *buff; 
struct mq attr attr; 
struct sigevent sigev; 


static void sig usrl(int); 
int 
main(int argc, char **argv) 
{ 
if (argc != 2) 
err quit("usage: mqnotifysigl <name>") ; 


/* open queue, get attributes, allocate read buffer */ 
mqd = Mq open(argv[1], O RDONLY); 
Mq getattr(mgd, &attr); 
buff - Malloc(attr.mq msgsize); 


/* establish signal handler, enable notification */ 
Signal(SIGUSR1, sig usr1); 
Sigev.sigev notify - SIGEV SIGNAL; 
Sigev.sigev signo = SIGUSR1; 
Mq notify (mgd, &sigev) ; 


fom wg) 
pause () ; /* signal handler does everything */ 
exit (0); 


} 


static void 
sig usrl(int signo) 


{ 


ssize t n; 


Mq notify (mgd, &sigev); /* reregister first */ 

n - Mq receive(mgd, buff, attr.mq msgsize, NULL); 
printf("SIGUSR1 received, read $1d bytes\n", (long) n); 
return; 


pxmsg/mqnotifysig 1.c 


某 个 空 队列 中 时 产生 SIGUSR1 (不 正确 版 本 ) 


T 


图 5-9 当 有 消息 放置 至 


= 


sig_usr1 结 束 处 的 retum 语 句 不 是 必要 的 ， 因 为 并 没有 返回 值 需 返回 , 


而 且 掉 出 该 画 数 的 末尾 也 是 一 个 向 调用 者 的 隐 式 返回 。 然 而 作者 总 会 在 信 
号 处 理 程序 的 末尾 写 上 一 个 显 式 的 return 语 句 ， 目 的 是 为 了 强调 从 这 种 函数 
的 返回 是 特殊 的 。 它 可 能 会 导致 处 理 该 信号 的 线程 中 某 个 函数 调用 过 早 返 
回 (返回 一 个 EINTR 错 误 ) 。 


我 们 现在 从 一 个 窗口 运行 这 个 程序 : 
solaris % mqcreate /test1 创建 队列 
solaris % mgnotifysig1 /test1 启动 图 5-9 中 的 程序 


从 另外 一 个 窗口 中 执行 如 下 命令 : 


solaris % mqsend /test1 50 16 发 送 50 字 节 优 先 级 为 16 的 
TH 

IE An Pr Sb, TÉ FF mynotifysig1 输出 : *SIGUSRI reveived,read 50 
bytes" ° 


我 们 可 以 验证 每 次 只 有 一 个 进程 可 被 注册 为 接收 通知 ， 方 法 是 从 另 一 
个 窗口 中 启动 该 程序 的 男 一 个 副本 : 
solaris % mqnotifysig1 /test1 


mq notify error: Device busy 

这 个 出 错 消 息 对 应 EBUSY 错 误 。 

5.6.2 Posix 信 号 : 异步 信号 安全 函数 

图 5-9 中 程序 的 问题 是 它 从 信号 处 理 程 序 中 调用 mq_notify、mq_receive 
和 Printf。 这 些 函 数 实际 上 都 不 可 以 从 信和 号 处 理 程序 中 调用 。 

Posix 使 用 异步 信号 安全 (async-signal-safe) 这 一 术语 描述 可 以 从 信和 号 
处 理 程序 中 调用 的 范 数 。 图 5-10 列 出 了 这 些 Posix 函 数 以 及 由 Unix 98 加 上 的 
其 他 几 个 函数 。 


access 
aio return 
aio suspend 
alarm 
cfgetispeed 
cfgetospeed 
cfsetispeed 
cfsetospeed 
chdir 
chmod 
chown 


clock gettime 
close 


creat 

dup 

dup2 
execle 
execve 
exit 
fcntl 
fdatasync 
fork 


fpathconf 
fstat 
fsync 
getegid 
geteuid 
getgid 
getgroups 
getpgrp 
getpid 
getppid 
getuid 
kill 
link 
lseek 
mkdir 
mkfifo 
open 
pathconf 
pause 
pipe 
raise 
read 


rename 
rmdir 

sem post 
setgid 
setpgid 
setsid 
setuid 
sigaction 
sigaddset 
sigdelset 
sigemptyset 
sigfillset 
sigismember 
signal 
sigpause 
sigpending 
sigprocmask 
sigqueue 
sigset 
sigsuspend 
sleep 

stat 


图 5-10 异步 信号 安全 的 画 数 


sysconf 
tcdrain 
tcflow 
tcflush 
tcgetattr 
tcgetpgrp 
tcsendbreak 
tcsetattr 
tcsetpgrp 
time 

timer getoverrun 
timer gettime 
timer settime 
times 

umask 

uname 

unlink 

utime 

wait 

waitpid 

write 


没有 列 在 该 表 中 的 函数 不 可 以 从 信号 处 理 程序 中 调用 。 注 意 所 有 标准 
L/OER Zi flipthread. XXX AAI A ER He ANS Bri us 0 A IPC EH BX 
中 ， 只 有 sem_post、read 和 write 列 在 其 中 (我 们 假定 read 和 write 可 用 于 管道 
和 FIFO) 。 

ANSI C 列 出 了 可 以 从 信号 处 理 程序 中 调用 的 四 个 函数 : abort ^ exit ^ 
longjmp 和 signal。Unix 98 没 有 把 前 三 个 函数 列 为 异步 信号 安全 贺 数 。 

5.6.3 AF: 信号 通知 

避免 从 信号 处 理 程序 中 调用 任何 函数 的 方法 之 一 是 : 让 处 理 程序 仅仅 
设置 一 个 全 局 标志 ， 由 某 个 线程 检查 该 标志 以 确定 何 时 接收 到 一 个 消息 。 
图 5-11 展 示 了 这 种 技巧 ， 不 过 它 含 有 另外 一 个 错误 ， 我 们 不 久 会 讲 到 。 

全 局 变量 


2 既然 信号 处 理 程序 执行 的 唯一 操作 走 把 mqflag 置 为 非 零 ， 于 十 岁 5-9 
中 的 全 局 变量 不 必 仍然 是 全 局 变量 。 降 低 全 局 变量 的 数目 肯定 古 一 种 好 技 
巧 ， 当 使 用 线程 时 尤为 如 此 。 


pxmsg/mqnotifysig2.c 
1 #include "unpipc.h" 
2 volatile sig atomic t mqflag; /* set nonzero by signal handler */ 
3 static void sig usrl(int); 
4 int 
5 main(int argc, char **argv) 
6 { 
7 mqd t mqd; 
8 void *buff; 
9 ssize t n; 
10 sigset t zeromask, newmask, oldmask; 
11 struct mq attr attr; 
12 struct sigevent sigev; 
13 if (argc !- 2) 
14 err quit("usage: mqnotifysig2 <name>") ; 
15 /* open queue, get attributes, allocate read buffer */ 
16 mqd = Mq open(argv[1], O RDONLY); 
17 Mq getattr(mgd, &attr); 
18 buff = Malloc(attr.mq_msgsize) ; 
19 Sigemptyset (&zeromask) ; /* no signals blocked */ 
20 Sigemptyset (&newmask) ; 
21 Sigemptyset (&oldmask) ; 
22 Sigaddset (&newmask, SIGUSR1) ; 
23 /* establish signal handler, enable notification */ 
24 Signal (SIGUSR1, sig_usr1l) ; 
25 sigev.sigev_notify = SIGEV_SIGNAL; 
26 sigev.sigev_signo = SIGUSR1; 
27 Mq_notify(mqd, &sigev) ; 
28 for (3) { 
29 Sigprocmask (SIG BLOCK, &newmask, &oldmask); /* block SIGUSR1 */ 
30 while (mqflag == 0) 
31 sigsuspend (&zeromask) ; 
32 mqflag = 0; /* reset flag */ 
33 Mq_notify(mqd, &sigev) ; /* reregister first */ 
34 n = Mq receive (mqd, buff, attr.mq msgsize, NULL); 
35 printf ("read $1d bytes\n", (long) n); 
36 Sigprocmask(SIG UNBLOCK, &newmask, NULL); /* unblock SIGUSR1 */ 
37 ) 
38 exit (0); 
39 } 
40 static void 
41 sig usrl(int signo) 
42 { 
43 mqflag = 1; 
44 return; 
45 } 
pxmsg/mgnotifvsig2.c 


图 5-11 信号 处 理 程序 只 是 给 主线 程 设置 一 个 标志 (不 正确 版 本 ) 


打开 消息 队列 

15~18 打开 通过 命令 行 参数 指定 的 消息 队列 ， 获 取 其 属性 ， 然 后 分 配 
一 个 读 缓 冲 区 。 

初始 化 信号 集 

19~ 22 初始 化 三 个 信号 集 ， 并 在 newmask 集 中 打开 对 应 SIGUSR1 的 
位 。 

建立 信号 处 理 程序 ， 启 用 通知 

23~27 给 SIGUSR1 建 立 一 个 信号 处 理 程序 ， 填 写 sigevent 结 构 ， 调 用 
mq notify ° 

等 待 信号 处 理 程序 设置 标志 

28 ~ 32 调用 sigprocmask 阻 塞 SIGUSR1， 并 把 当前 信号 掩 码 保存 到 
oldmask 中 。 随 后 在 一 个 循环 中 测试 全 局 变量 mqflag， 以 等 待 信号 处 理 程序 
将 它 设置 成 非 零 。 只 要 它 为 0， 我 们 就 调用 sigsuspend， 它 原子 性 地 将 调用 
线程 投入 睡眠 ， 并 把 它 的 信号 掩 码 复位 成 zeromask 《没有 一 个 信和 号 被 阻 
塞 ) 。APUE 的 10.16 节 详细 讨论 sigsuspend 以 及 为 什么 只 能 在 SIGUSR1 被 阻 
塞 时 测试 mqflag 变 量 。 每 次 sigsuspend 返 回 时 ，SIGUSR1 被 重新 阻塞 。 

重新 注册 并 读 出 消息 

33~36 当 mdqflag 为 非 零 时 ， 重 新 注册 并 从 指定 队列 中 读 出 消息 。 随后 
给 SIGUSR1 解 阻 豆 并 返回 for 循 环 顶 部 。 

我 们 提 到 过 这 种 办 法 仍 存在 一 个 问题 。 考 虑 一 下 第 一 个 消息 被 读 出 之 
前 有 两 个 消息 到 达 的 情形 。 我 们 可 通过 在 mq_notify 调 用 前 增加 一 个 sleep 语 
句 来 模拟 这 种 情形 。 这 里 的 基本 问题 是 : 通知 只 是 在 有 一 个 消息 被 放置 到 
某 个 空 队列 上 时 才 发 出 。 如 果 在 能 够 读 出 第 一 个 消息 前 有 两 个 消息 到 达 ， 
那么 只 有 一 个 通知 被 发 出 : 我 们 于 是 读 出 第 一 个 消息 ， 并 调用 sigsuspend 等 
每 男 一 个 消息 ， 而 对 应 它 的 通知 可 能 永远 不 会 发 出 。 在 此 期 间 ， 男 一 个 消 
奶 已 放置 于 该 队列 中 等 待 读 出 ， 而 我 们 却 一 直 在 忽略 它 。 

5.6.4 例子 : 使 用 非 阻塞 mq_receive 的 信 号 通知 


上 述 问 题 的 解决 办 法 是 : 当 使 用 mq_notify 产 生 信号 时 ， 总 是 以 非 阻 塞 
模式 读 消 息 队 列 。 图 5-12 给 出 了 图 5-11 的 一 个 修改 版 本 ， 它 以 非 阻塞 模式 
读 消息 队列 。 


pxmsg/mqnotifysig3.c 
1 include "unpipc.h" 

2 volatile sig atomic t mqflag; /* set nonzero by signal handler */ 

3 static void sig usrl (int); 

4 int 

5 main(int argc, char **argv) 


6 { 


7 mqd t mqd; 

8 void *buff; 

9 ssize t n; 

10 Sigset t zeromask, newmask, oldmask; 

TT struct mq attr attr; 

12 struct sigevent sigev; 

13 if (argc != 2) 

14 err quit("usage: mqnotifysig3 <name>"); 

15 /* open queue, get attributes, allocate read buffer */ 
16 mgd = Mq open(argv[1], O RDONLY | O NONBLOCK) ; 

17 Mq getattr(mgd, &attr); 

18 buff - Malloc(attr.mq msgsize); 

19 Sigemptyset (&zeromask) ; /* no signals blocked */ 

20 Sigemptyset (&newmask) ; 

21 Sigemptyset (&oldmask) ; 

22 Sigaddset(&newmask, SIGUSR1) ; 

23 /* establish signal handler, enable notification */ 
24 Signal (SIGUSR1, sig usrl); 


图 5-12 使 用 信号 通知 读 Posix 消 息 队列 


25 sigev.sigev notify = SIGEV SIGNAL; 


26 sigev.sigev signo = SIGUSR1; 

2 Mq notify (mgd, &sigev) ; 

28 > pi 

29 Sigprocmask(SIG BLOCK, &newmask, &oldmask); /* block SIGUSR1 */ 
30 while (mqflag == 0) 

31 sigsuspend (&zeromask) ; 

32 mqflag = 0; /* reset flag */ 

33 Mq_notify(mqd, &sigev) ; /* reregister first */ 

34 while ( (n = mq receive(mgd, buff, attr.mq msgsize, NULL)) >= 0) ( 
35 printf ("read $1d bytes\n", (long) n); 

36 ) 

37 if (errno != EAGAIN) 

38 err sys("mq receive error"); 

39 Sigprocmask(SIG UNBLOCK, &newmask, NULL); /* unblock SIGUSR1 */ 
40 } 

41 exit (0); 

42 } 


43 static void 
44 sig usrl(int signo) 


45 ( 

46 mgflag - 1; 
47 return; 

48 ) 


pxmsg/mqnotifysig3.c 


图 5-12 (4) 


打开 消息 队列 以 非 阻塞 模式 

157-18 第 一 个 变动 古 在 打开 消 恩 队列 时 指定 O_NONBLOCK 标 志 。 

从 队列 中 读 出 所 有 消息 

34~38 另 一 个 变动 是 在 一 个 循环 中 调用 mq_receive， 处 理 队 列 中 的 每 
个 消息 。 返 回 一 个 EAGAIN 错 误 不 表示 有 问题 ， 它 只 是 意味 着 和 暂时 没有 消 
Ad nist o 

5.6.5 例子 :使 用 sigwait 代 替 信 号 处 理 程 序 的 信号 通知 

上 一 个 例子 尽管 正确 ， 但 效率 还 可 以 更 高 些 。 我 们 的 程序 通过 调用 
sigsuspend 阻 塞 ， 以 等 竺 某 个 消息 的 到 达 。 当 有 一 个 消息 被 放置 到 某 个 空 队 
列 中 时 ， 该 信号 产生 ， 主 线程 被 阻止 ， 信 和 号 处 理 程 序 执行 并 设置 mqflag 变 
量 ， 主 线程 再 次 执行 ， 发 现 mq_flag 为 非 零 ， 于 是 读 出 该 消息 。 更 为 简易 

(并 且 可 能 更 为 高 效 ) 的 办 法 之 一 是 阻塞 在 某 个 函数 中 ， 仅 仅 等 待 该 信号 

的 递交 ， 而 不 是 让 内 核 执 行 一 个 只 为 设置 一 个 标志 的 信号 处 理 程序 。 
sigwait 提 供 了 这 种 能 


#include <signal.h> 
int sigwait(const sigset_t *set,int *sig); 
返回 : 者 成 功 则 为 0， 大 出 错 则 为 正 的 Exxx 值 

调用 sigwait 前 ， 我 们 阻塞 某 个 信号 集 。 我 们 将 这 个 信和 号 集 指定 为 set 参 
数 。sigwait 然 后 一 直 阻 塞 到 这 些 信号 中 有 一 个 或 多 个 待 处 理 ， 这 时 它 返 回 
其 中 一 个 信号 。 该 信号 值 通过 指针 sig 存 放 ， 画 数 的 返回 值 则 为 0。 这 个 过 
程 称 为 “同步 地 等 待 一 个 异步 事件 ”: 我 们 是 在 使 用 信号 ， 但 没有 涉及 异步 
言 号 处 理 程 序 。 

5-13 给 出 了 用 到 sigwait 时 mq_notify 的 使 用 。 


pxmsg/mqnotifysig4.c 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

a { 

5 int signo; 

6 mqd t mqd; 

7 void *buff; 

8 ssize t n; 

9 sigset t newmask; 

10 struct mq attr attr; 

11 struct sigevent sigev; 

12 if (argc != 2) 

13 err quit("usage: mgnotifysig4 <name>") ; 

14 /* open queue, get attributes, allocate read buffer */ 
15 mqd = Mq open(argv[1], O RDONLY | O NONBLOCK) ; 

16 Mq getattr (mgqd, &attr); 

17 buff - Malloc(attr.mq msgsize); 

18 Sigemptyset (&newmask) ; 

19 Sigaddset (&newmask, SIGUSR1) ; 

20 Sigprocmask (SIG BLOCK, &newmask, NULL); /* block SIGUSR1 */ 
21 /* establish signal handler, enable notification */ 
22 Sigev.sigev notify = SIGEV SIGNAL; 

23 Sigev.sigev signo = SIGUSR1; 

24 Mq notify (mgd, &sigev); 

25 for (; ; 0) { 

26 Sigwait(&newmask, &signo); 

oy if (signo == SIGUSR1) { 

28 Mq_notify(mqd, &sigev) ; /* reregister first */ 
29 while ( (n = mq_receive(mqd, buff, attr.mq_msgsize, NULL)) >= 0) { 
30 printf ("read $1d bytes\n", (long) n); 

31 } 

32 if (errno != EAGAIN) 

33 err sys ("md receive error"); 

34 ) 

35 } 

36 exit (0); 

3T } 


pxmsg/mqnotifysig4.c 


图 5-13 伴随 sigwait 使 用 mq_notify 


初始 化 信和 号 集 并 阻塞 SIGUSR1 

18~20 把 某 个 信号 集 初 始 化 成 只 含有 SIGUSR1， 然 后 用 sigprocmask 阻 
塞 该 信号 。 

等 待 信号 

26~ 34 在 sigwait 调 用 中 阻塞 并 等 待 该 信号 。SIGUSR1 被 递交 后 ， 重 新 
注册 通知 并 读 出 所 有 可 用 消息 。 


sigwait 往 往 在 多 线程 化 的 进程 中 使 用 。 实 际 上 ， 看 一 看 它 的 函数 原 
型 ， 我 们 会 发 现 其 返回 值 或 为 0， 或 为 某 个 Exxx 错 误 ， 这 与 大 多 数 Pthread 
函数 一 样 。 但 是 在 多 线程 化 的 进程 中 不 能 使 用 sigprocmask， 而 必须 调用 
pthread_sigmask， 它 只 是 改变 调用 线程 的 信号 掩 码 。pthread_sigmask 的 参 
数 与 sigprocmask 的 相同 。 

sigwait 存 在 两 个 变种 : sigwaitinfo 和 sigtimedwait。sigwaitinfo 还 返回 一 
个 siginfo_t 结 构 (将 在 下 一 节 中 定义 ) ， 目 的 是 用 于 可 靠 信号 中 。 
sigtimedwait 也 返回 一 个 siginfo_t 结 构 ， 并 人 允许 调用 者 指定 一 个 时 间 限 制 。 

大 多 数 讨论 线程 的 书 (例如 [Butenhof 1997] ) 推荐 在 多 线程 化 的 进 
程 中 使 用 sigwait 来 处 理 所 有 信和 号， 而 绝 不 要 使 用 异步 信号 处 理 程序 。 

5.6.6 例子 : 使 用 select 的 Posix 消 息 队 列 

消息 队列 描述 符 (mqd_t 变 量 ) 不 是 “普通 ”描述 符 ， 它 不 能 用 在 select 
或 poll (UNPv1 第 6 章 ) 中 。 然 而 我 们 可 以 伴随 一 个 管道 和 mq_notify 函 数 使 
用 它们 。 (我 们 将 在 6.9 节 中 随 System V 消 息 队 列 展 示 类 似 的 技巧 ， 那 时 涉 
及 的 是 一 个 子 进程 和 一 个 管道 。) 首先 ， 从 图 5-10 注 意 到 write 函数 是 异步 
信和 号 安全 的 ， 因 此 可 以 从 信和 号 处 理 程序 中 调用 它 。 图 5-14 给 出 了 我 们 的 程 
序 o 


1 #include "unpipc.h" 


2 int 


pipefd[2]; 


3 static void sig usrl(int); 


4 int 


5 main(int argc, char **argv) 


6 { 


\ oN 


10 
11 
12 
13 
14 


15 
16 


17 
18 
19 
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21 


22 
23 
24 
25 
26 


27 
28 
29 
30 


31 
32 


int nfds; 
char C; 

fd set rset; 
mad t mqd; 


void *buff; 

ssize t n; 

struct mq attr attr; 
struct sigevent sigev; 


if (argc !- 2) 
err quit("usage: mgnotifysig5 <name>") ; 


/* open queue, get attributes, allocate read buffer */ 
mgd - Mq open(argv[1], O RDONLY | O NONBLOCK); 
Mq getattr(mgd, &attr); 
buff - Malloc(attr.mq msgsize); 


Pipe (pipefd) ; 


/* establish signal handler, enable notification */ 
Signal (SIGUSR1, sig usr1); 
sigev.sigev_notify = SIGEV_SIGNAL; 
sigev.sigev_signo = SIGUSR1; 
Mq_notify(mqd, &sigev) ; 


FD ZERO(&rset); 
for (0,5. 31 
FD SET(pipefd[0], &rset); 
nfds = Select(pipefd[0] + 1, &rset, NULL, NULL, NULL); 


if (FD ISSET(pipefd[0], &rset)) ( 
Read(pipefd[0], &c, 1); 


图 5-14 伴随 管道 使 用 信和 号 通知 
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33 Mq notify (mgqd, &sigev); /* reregister first */ 


34 while ( (n = mq receive(mqgd, buff, attr.mq msgsize, NULL)) >= 0) { 
35 printf ("read $1d bytes\n", (long) n); 

36 } 

37 if (errno != EAGAIN) 

38 err_sys("mq_receive error") ; 

39 } 

40 } 

41 exit (0); 


42 } 


43 static void 
44 sig usrl(int signo) 


46 Write(pipefd[1], "", 1); /* one byte of 0 */ 
47 return; 
48 ) 


pxmsg/mqnotifysig5.c 


图 5-14 (22) 


创建 一 个 管道 

21 创建 一 个 管道 ， 当 接收 到 消 恩 队列 的 异步 事件 通知 时 ， 信 号 处 理 程 
序 就 会 往 该 管道 中 写 入 数据 。 这 是 一 个 管道 用 于 信和 号 处 理 程序 中 的 例子 。 

调用 select 

27--40 初始 化 描述 符 集 rset， 每 次 循环 时 打开 对 应 于 pipefd[0] (管道 的 
读 出 端 ) 的 那 一 位 。 然 后 调用 select 只 等 待 该 描述 符 ， 不 过 在 典型 的 应 用 
中 ， 这 儿 是 多 个 描述 符 上 的 输入 或 输出 复 用 的 地 方 。 当 管道 的 读 出 端 可 读 
时 ， 重 新 注册 消息 队列 的 通知 ， 并 读 出 所 有 可 得 的 消息 。 

信号 处 理 程序 

43--48 我 们 的 信号 处 理 程序 只 是 往 管道 write 1 个 字 节 。 我 们 已 提 及 这 
是 一 个 异步 信号 安全 的 操作 。 

5.6.7 例子 : 启动 线程 

异步 事件 通知 的 另 一 种 方式 是 把 sigev notify 设置 成 
SIGEV THREAD , 这 会 创建 一 个 新 的 线程 。 该 线程 调用 由 
sigev_notify_function 指 定 的 函数 ， 所 用 的 参数 由 sigev_value 指 定 。 新 线程 
的 线程 属性 由 sigev_notify_attributes 指 定 ， 要 是 默认 属性 合适 的 话 ， 它 可 以 
是 一 个 空 指针 。 图 5-15 给 出 了 使 用 这 种 技术 的 一 个 例子 。 


我 们 把 给 新 线程 的 参数 (sigev value) 指定 成 一 个 空 指针 ， 因 此 不 会 
有 任何 东西 传递 给 该 线程 的 起 始 函 数 。 我 们 能 以 参数 的 形式 传递 一 个 指 回 
所 处 理 消息 队列 描述 符 的 指针 ， 而 不 是 把 它 声 明 为 一 个 全 局 变量 ， 不 过 新 
线程 仍然 需要 消息 队列 属性 和 sigev 结 构 (以 便 重新 注册 ) 。 我 们 把 给 新 线 
程 的 属性 指定 成 一 个 空 指针 ， 因 此 使 用 的 是 系统 默认 属性 。 这 样 的 新 线程 
是 作为 脱离 的 线程 创建 的 。 

遗憾 的 是 ， 本 书 例子 所 用 的 两 个 系统 (Solaris 2.6 和 Digital Unix 
4.0B) 没有 一 个 支持 SIGEV_THREAD 。 这 两 个 系统 都 要 求 sigev_notify 或 者 
为 SIGEV_NONE， 或 者 为 SIGEV_SIGNAL ° 


pxmsg/mqnotifythreadl.c 
1 #include "unpipc.h" 


2 mgd t mqd; 
3 struct mq attr  attr; 
4 struct sigevent sigev; 


5 static void notify thread(union sigval); /* our thread function */ 
6 int 

7 main(int argc, char **argv) 

8 ( 

9 if (argc !- 2) 

10 err quit("usage: mgnotifythreadl <name>") ; 

il mgd = Mq open(argv[1], O RDONLY | O NONBLOCK); 

12 Mq getattr(mgd, &attr); 

13 sigev.sigev notify - SIGEV THREAD; 

14 sigev.sigev value.sival ptr = NULL; 

15 Sigev.sigev notify function - notify thread; 

16 Sigev.sigev notify attributes = NULL; 

Iz Mq_notify(mqd, &sigev); 

18 for 6 rs 

19 pause () ; /* each new thread does everything */ 
20 exit(0); 

21 ) 


22 static void 
23 notify thread(union sigval arg) 


24 ( 

25 ssize tn; 

26 void *buff; 

27 printf ("notify thread started\n") ; 

28 buff = Malloc(attr.mq_msgsize) ; 

29 Mq_notify(mqd, &sigev) ; /* reregister */ 
30 while ( (n = mq receive(mgd, buff, attr.mq msgsize, NULL)) »- 0) ( 
31 printf ("read $1d bytes\n", (long) n); 
32 } 

33 if (errno != EAGAIN) 

34 err_sys("mq_receive error") ; 

35 free (buff) ; 

36 pthread_exit (NULL) ; 

37 } 


pxmsg/mqnotifythreadl.c 


图 5-15 启动 一 个 新 线程 的 mq_notify 


5.7 Posix 实 时 信号 


在 过 去 几 十 年 中 ，Unix 信 和 号 经 历 了 多 次 重大 的 演变 。 
(由 Version 7 Unix (19784F) 提供 的 信和 号 模型 是 不 可 靠 的 。 信 和 号 可 能 
丢失 ， 而 且 进 程 难以 在 执行 临界 代码 段 时 关 掉 选中 的 若干 信号 。 


(24.3BSD (1986 年 ) 增加 了 可 靠 的 信号 。 

(3)System V Release 3.0 (19864E) 也 增加 了 可 靠 的 信号 ， 不 过 不 同 于 
BSD 模 型 。 

(A)Posixl (1990 年 ) 标准 化 了 BSD 可 靠 信 号 模型 ，APUE 的 第 10 章 详 
细 讲 述 了 该 模型 。 

(5)Posix.1 (19964F) 给 Posix 模 型 增加 了 实时 信号 。 该 工作 起 源 于 
Posix.1b 实 时 扩展 (以 前 称 为 Posix.4) ° 

当今 几乎 每 种 Unix 系 统 都 提供 Posix 可 靠 信号 ， 更 新 的 系统 正在 逐步 提 
供 Posix 实 时 信号 。 (在 描述 信号 时 ， 注 意 区 分 可 靠 和 实时 。) 我 们 有 必要 
较 详 细 地 讨论 实时 信号 ， 因 为 已 在 上 一 节 中 使 用 过 由 这 个 扩展 定义 的 一 些 
结构 (sigval 结 构 和 sigevent 结 构 ) 。 

言 号 可 划分 为 两 个 大 组 。 

(1) 其 值 在 SIGRTMIN 和 SIGRTMAX 之 间 (包括 两 者 在 内 ) 的 实时 信 
号 。Posix 要 求 至 少 提供 RTSIG_MAX 种 实时 信号 ， 而 该 常 值 的 最 小 值 为 8。 

(2) 所 有 其 他 信号 :SIGALRM、SIGINT、SIGKILL 等 。 

Solaris 2.6 上 普通 Unix 信 号 的 值 为 1~37，8 种 实时 信和 号 的 值 为 38~-45。 
Digital Unix 4.0B 上 普通 Unix 信 号 的 值 为 1 一 32，16 种 实时 信号 的 值 为 33 一 
48。 这 两 种 实现 都 把 SIGRTMIN 和 SIGRTMAX 定 义 为 调用 sysconf 的 宏 ， 以 
允许 在 将 来 修改 它们 的 值 。 

接 下 去 我 们 关注 接收 某 个 信号 的 进程 的 sigaction 调 用 中 是 否 指定 了 新 


的 SA_SIGINFO 标 志 。 这 些 差 异 市 来 了 图 5-16 中 所 示 的 四 种 可 能 情形 。 


sigaction 调 用 
SA_SIGINFO 已 指定 SA_SIGINFO 未 指定 


实时 行为 有 保证 实时 行为 未 指定 


所 有 其 他 信和 号 实时 行为 未 指定 实时 行为 未 指定 


到 5-16 Posix 信 号 实时 行为 ， 取 决 于 SA_SIGINFO 


其 中 有 三 个 框 标 以 “实时 行为 未 指定 ”， 其 含义 是 有 些 实现 可 能 提供 实 
时 行为 ， 有 些 实现 可 能 不 提供 。 如 果 需 要 实时 行为 ， 我们 必须 使 用 
SIGRTMIN 和 SIGRTMAX 之 间 的 新 的 实时 信号 ， 而 且 在 安装 信号 处 理 程 序 
时 必须 给 sigaction 指 定 SA_SIGINFO 标 志 。 

术语 实时 行为 (realtime behavior) 隐 含 着 如 下 特征 。 

言 号 是 排队 的 。 这 就 是 说 ， 如 果 同 一 信号 产生 了 三 次 ， 它 吏 递 交 三 
次 。 另 外 ， 一 种 给 定 信 号 的 多 次 发 生 以 先进 先 出 (FIFO) 顺序 排队 。 我 们 
不 久 将 给 出 一 个 信号 排队 的 例子 。 

对 于 不 排队 的 信号 来 说 ， 产 生 了 三 次 的 某 种 信号 可 能 只 递交 一 次 。 

当 有 多 个 SIGRTMIN 到 SIGRTMAX 范 围 内 的 解 阻 塞 信号 排队 时 ， 值 较 
小 的 信号 先 于 值 较 大 的 信号 递交 。 这 就 是 说 ，SIGRTMIN 比值 为 
SIGRTMIN+1 的 信号 “更 为 优先 ”*”"， 值 为 SIGRTMIN+1 的 信号 比值 为 
SIGRTMIN+2 的 信号 “更 为 优先 *"， 依 此 类 推 。 

当 某 个 非 实 时 信和 号 递交 时 ， 传 递 给 它 的 信号 处 理 程序 的 唯一 参数 是 该 
言 号 的 值 。 实 时 信号 比 其 他 信号 携 市 更 多 的 信息 。 通 过 设置 SA_SIGINFO 
标志 安装 的 任意 实时 信和 号 的 信号 处 理 程序 声明 如 下 : 

void func(int signo,siginfo t *info,void *context); 

其 中 signo 是 该 信号 的 值 ，siginfo_t 结 构 则 定义 如 下 : 

typedef struct { 


int Si signo; /* same value as signo argument */ 
int si code; pt 
SI {USER,QUEUE,TIMER,AS YNCIO,MEGEQ} */ 
unionsigval si value; /* integer or pointer value from sender */ 
} siginfo t; 


context 参 数 所 指 加 的 内 容 依赖 于 实现 。 

技术 上 讲 ， 非 实时 Posix 信 和 号 的 处 理 程序 只 用 一 个 参数 调用 。 许 多 系统 
有 一 个 较 早 的 使 用 三 个 参数 的 约定 ， 适 用 于 先 于 Posix 实 时 标准 的 信号 处 理 
程序 。 


siginfo_t 是 使 用 typedef 定 义 的 具有 以 _t 结 尾 的 名 字 的 唯一 一 个 Posix 结 
构 。 图 5-17 中 我 们 把 指向 这 些 结构 的 指针 声明 为 siginfo_t* ， 而 不 出 现 struct 
一 词 [Z] ° 

一 些 新 函数 定义 成 使 用 实时 信号 工作 。 例 如 ，sigqueue 函 数 用 于 代替 
kill 函数 向 某 个 进程 发 送 一 个 信号 ， 该 新 函数 允许 发 送 者 随 所 发 送信 号 传递 
一 个 sigval 联 合 。 

实时 信号 由 下 列 Posix.1 特 性 产生 ， 它 们 由 包含 在 传递 给 
的 siginfo_t 结 构 中 的 si_code 值 来 标识 。 

SI ASYNCIO 信号 由 某 个 异步 /0O 请 求 的 完成 产生 ， 这 些 异 步 /O 请 求 
就 是 Posix 的 aio_XXX 了 函数 ， 我 们 不 讲述 。 

SLMESGQ 信号 在 有 一 个 消息 被 放置 到 某 个 空 消息 队列 中 时 产生 ， 如 
5.61) Arde 。 

SI QUEUE (85 Hisigqueue KRA H1 ° a RITE E E — T IRURE E A 
子 o 

SI TIMER 信和 号 由 使 用 timer_settime 画 数 设 置 的 某 个 定时 器 的 到 时 产 
生 ， 我 们 不 讲述 。 

SI. USER 信号 由 Kill 函数 发 出 。 

如 果 信 号 是 由 某 个 其 他 事件 产生 的 ，si_code 就 会 被 设置 成 不 同 于 这 里 
Pr i AN FE 1B oo siginfo_t 24 #4 AY si_value AY it AY AN R Æ si_code 为 
SI ASYNCIO ` SI MESGQ ` SI QUEUESESI TIMERHJZI Ax ° 

5.7.1 例子 

图 5-17 是 一 个 演示 实时 信号 的 简单 程序 。 该 程序 调用 fork， 子 进程 阻 
塞 三 种 实时 信号 ， 父 进程 随后 发 送 9 个 信号 (三 种 实时 信号 中 每 种 3 个 ) ， 
子 进 程 接 着 解 阻 塞 信号 ， 我 们 于 是 看 到 每 种 信号 各 有 多 少 个 递交 以 及 它们 
的 移 后 递交 顺序 。 

输出 实时 信号 值 

10 输出 最 小 和 最 大 实时 信号 值 ， 以 查看 系统 实现 支持 多 少 种 实时 信 
号 。 我 们 把 这 两 个 常 值 类 型 强制 转换 成 一 个 整数 ， 因 为 有 些 实现 把 这 两 个 


处 理 程序 


ui 
J 


常 值 定义 为 调用 sysconf 的 安 ， 例 如 : 

#define SIGRTMAX (sysconf( SC RTSIG MAX)) 

而 sysconf 返 回 一 个 长 整数 (0,2 5885.4) ° 

fork: 子 进程 阻塞 三 种 实时 信和 号 

117-17 派生 一 个 子 进程 ， 由 子 进 程 调用 sigprocmask 阳 塞 我 们 将 使 用 的 
三 种 实时 信号 : SIGRTMAX ` SIGRTMAX-1 ` SIGRTMAX-2 ° 


rtsignals/testl.c 


1 #include "unpipc.h" 


2 static void sig rt(int, siginfo t *, void *); 


3 int 

4 main(int argc, char **argv) 

5 { 

6 int i; j; 

7 pid t pid; 

8 sigset t newset; 

9 union sigval val; 

10 printf("SIGRTMIN = %d, SIGRTMAX = %d\n", (int) SIGRTMIN, (int) SIGRTMAX); 
TI if ( (pid = Fork()) == 0) { 

12 /* child: block three realtime signals */ 

13 Sigemptyset (&newset) ; 

14 Sigaddset (&newset, SIGRTMAX); 

15 Sigaddset (&newset, SIGRTMAX - 1); 

16 Sigaddset (&newset, SIGRTMAX - 2); 

II Sigprocmask(SIG BLOCK, &newset, NULL); 

18 /* establish signal handler with SA SIGINFO set */ 

19 Signal rt(SIGRTMAX, sig rt, &newset); 

20 Signal rt(SIGRTMAX - 1, sig rt, &newset); 

21 Signal rt(SIGRTMAX - 2, sig rt, &newset); 

22 sleep(6); /* let parent send all the signals */ 
23 Sigprocmask(SIG UNBLOCK, &newset, NULL); /* unblock */ 

24 sleep(3); /* let all queued signals be delivered */ 
25 exit (0); 

26 ) 

27 /* parent sends nine signals to child */ 

28 sleep (3); /* let child block all signals */ 
29 for (i = SIGRTMAX; i >= SIGRTMAX - 2; i--) { 

30 for (j = 0; j <= 2; j++) { 

31 val.sival_int = j; 

32 Sigqueue (pid, i, val); 

33 printf ("sent signal %d, val = %d\n", i, j); 

34 } 

35 } 

36 exit (0) ; 

37 } 


38 static void 
39 sig rt(int signo, siginfo t *info, void *context) 


40 ( 

41 printf ("received signal #%d, code = %d, ival = %d\n", 
42 signo, info->si_code, info->si_value.sival_int) ; 
43 } 


rtsignals/testl.c 


图 5-17 演示 实时 信号 的 简单 测试 程序 
建立 信号 处 理 程序 
18~21 调用 signal_rt 画 数 (将 在 图 5-18 中 给 出 ) ， 建 立 我 们 的 sig_rt 范 
数 来 作为 这 三 种 实时 信和 号 的 处 理 程序 。 该 贸 数 设置 SA_SIGINFO 标 志 ， 青 


加 上 这 三 种 信和 号 都 是 实时 信号 ， 于 征 我 们 预期 它们 具备 实时 行为 。 该 函数 
还 设置 执行 信号 处 理 程序 期 间 需 阻塞 的 信号 掩 码 [8] 。 

等 待 父 进程 产生 信和 号， 然后 解 阻塞 信号 

22~ 25 等 每 6 秒 以 允许 父 进 程 产生 预定 的 9 个 信和 号。 然后 调用 
sigprocmask 解 阻塞 那 三 种 实时 信号。 该 操作 应 允许 所 有 排队 的 信号 都 被 弟 
交 。 子 进程 停顿 男 外 3 秒 ， 以 便 信号 处 理 程 序 调用 printf 9 次 ， 然 后 终止 。 

父 进程 发 送 9 个 信和 号 

27~36 父 进程 停顿 3 秒 ， 以 便 子 进程 阻塞 所 有 信号 。 父 进程 随后 给 那 
三 种 实时 信号 的 第 一 种 产生 3 个 信号 : i 取 这 三 种 实时 信号 的 值 ， 对 于 每 个 i 
值 ，j 取 值 为 0、1 和 2。 我 们 特意 从 最 高 的 信号 值 开 始 产生 信号 ， 因 为 期 行 
它们 从 最 低 的 信号 值 开始 递交 。 我 们 还 伴随 每 个 信和 号 发 送 一 个 不 同 的 整数 
值 (sival_int) ， 以 验证 一 种 给 定 信 号 的 3 次 发 生 古 按 FIFO 的 顺序 产生 的 。 

信号 处 理 程序 

38~43 我 们 的 信号 处 理 程 序 只 是 输出 所 递 区 信号 的 有 关 信 息 。 

我 们 从 图 5-10 注 意 到 printf 不 是 异步 信号 安全 的 ， 因 而 不 能 从 信和 号 处 理 
程序 中 调用 。 在 这 儿 的 小 测试 程序 中 ， 我 们 将 它 作 为 一 个 简单 的 诊断 工具 


来 调用 。 [9] 

我 们 首先 在 Solaris 2.6 下 运行 该 程序 ， 但 是 发 现 它 的 输出 与 我 们 预期 的 
不 一 致 。 

solaris 96 test1 

SIGRTMIN = 38,SIGRTMAX = 45 提供 8 种 实时 
信和 号 


这 儿 停 顿 3 秒 

父 进 程 现在 发 送 9 个 信和 号 
sent signal 45,val = 0 sent signal 45,val = 1 
sent signal 45,val = 2 
sent signal 44,val = 0 


static volatile siginfo t arrival[10]; 


static volatile int nsig; 
然后 让 信号 处 理 程序 在 该 数组 中 保存 其 info 参 数 : 
static void 
sig_rt(int signo,siginfo_t *info,void *context) 
{ 
arrival[nsig++] = *info; /* save info for child to print */ 
} 
最 后 由 子 进程 在 终止 前 输出 该 数组 中 的 信息 .: 
sleep(3); /* let all queued signals be delivered */ 
for (i = 0; i < nsig; i++){ 
printf("received signal #%d,code = 96d,ival = %d\n", 
arrival[i].si signo,arrival[i].si code, 
arrival[i|si value.sival int); 
} 
exit(0); 
sent signal 44,val = 1 
sent signal 44,val = 2 
sent signal 43,val = 0 
sent signal 43,val = 1 


sent signal 43,val = 2 


solaris 96 父 进程 终止 ，shell 提 示 符 
输出 
在 子 进程 解 阻 塞 信 号 前 
停顿 3 秒 
received signal #45,code = -2,ival = 2 子 进 程 捕 获 信号 received 


signal #45,code = -2,ival = 1 
received signal #45,code = -2,ival = 0 


received signal #44,code = -2,ival = 2 


received signal #44,code = -2,ival = 1 

received signal #44,code = -2,ival = 0 

received signal #43,code = -2,ival = 2 

received signal #43,code = -2,ival = 1 

received signal #43,code = -2,ival = 0 

父 进程 发 送 的 9 个 信号 排 了 队 ， 但 是 那 三 种 信号 是 从 值 最 大 的 信号 开 

台 产 生 的 〈 而 我 们 却 期 待 值 最 小 的 信号 最 先 产生 ) 。 对 于 一 种 给 定 信和 号 ， 

它 的 3 个 排 了 队 的 信号 看 来 是 以 LIFO 顺 序 而 不 是 FIFO 顺 序 递 交 的 。 值 为 -2 
的 Si_code 对 应 SL QUEUE ° 

RESCUE Digital Unix 4.0B 下 运行 该 程序 ， 我 们 看 到 了 预期 的 结果 。 

alpha 96 test1 

SIGRTMIN - 33,SIGRTMAX - 48 提供 16 种 实时 信号 

这 儿 集 顿 3 秒 


sent signal 48,val = 0 
父 进程 现在 发 送 9 个 信和 号 
sent signal 48,val = 1 
sent signal 48,val = 2 
sent signal 47,val = 0 
sent signal 47,val = 1 
sent signal 47,val = 2 
sent signal 46,val = 0 
sent signal 46,val = 1 
sent signal 46,val = 2 
alpha 96 父 进程 终 
止 ，shell 提 示 符 输出 
在 子 进 程 解 阻 塞 信号 前 停顿 3 秒 
received signal #46,code = -1,ival = 0 子 进 程 捕获 信和 号 received 
signal #46,code = -1,ival = 1 


received signal #46,code = -1,ival = 2 


received signal #47,code = -1,ival = 0 


received signal #47,code = -1,ival = 1 


received signal #47,code = -1,ival = 2 


received signal #48,code = -1,ival = 0 


received signal #48,code = -1,ival = 1 


received signal #48,code = -1,ival = 2 

父 进程 发 送 的 9 个 信号 排队 后 按 我 们 期 待 的 顺序 递交 : 值 最 小 的 信号 
最 移 递 区 ， 对 于 一 种 给 定 信号 ， 它 的 3 次 发 生 按 FIFO 顺 序 递交 。 

Solaris 2.6 的 实现 看 来 存在 缺陷 。 

5.7.2 signal_rt Hav 

我 们 在 UNPv1 第 120 页 给 出 了 上 自己 的 signal 函 数 ， 它 调用 Posix sigaction 
函数 建立 一 个 提供 可 靠 Posix 语 义 的 信号 处 理 程序 。 现 在 我 们 把 该 函数 修改 
成 提供 实时 行为 。 我 们 称 这 个 新 函数 为 signal_ rt， 如 图 5-18 所 示 。 


lib/signal rt.c 


1 #include "unpipc.h" 

2 Sigfunc rt * 

3 signal rt(int signo, Sigfunc rt *func, sigset-t *mask) 

4 { 

5 struct sigaction act, oact; 

6 act.sa_sigaction = func; /* must store function addr here */ 
7 act.sa_mask = *mask; /* signals to block */ 

8 act.sa_flags = SA_SIGINFO; /* must specify this for realtime */ 
9 if (signo == SIGALRM) { 

10 #ifdef SA INTERRUPT 

TI act.sa flags |- SA INTERRUPT; /* SunOS 4.x */ 
12 #endif 

13 ) eise ( 

14 #ifdef SA RESTART 

15 act.sa flags |- SA RESTART; /* SVR4, 44BSD */ 
16 #endif 

17 } 

18 if (sigaction(signo, &act, &oact) < 0) 

19 return ((Sigfunc_rt *) SIG ERR); 

20 return (oact.sa_sigaction) ; 

21 } 


lib/signal rt.c 


图 5-18 提供 实时 行为 的 signal_rt 函 数 


IE typedef ERRUR A 


17-3 在 我 们 的 unpipc.h 头 文件 (图 C-1) 中 ，Sigfunc_rt 定 义 如 下 : 

typedef void Sigfunc rt(int,siginfo t *,void *); 

我 们 在 本 世 早 先 说 过 ， 这 是 在 设置 SA_SIGINFO 标 志 的 前 提 下 安装 的 
言 号 处 理 程序 的 函数 原型 。 

指定 处 理 程序 函数 

5~7 加 入 实时 信号 支持 后 ，sigaction 发 生变 化 ， 即 增加 了 新 的 


sa_sigaction 成 员 。 


struct sigaction { 
void (*sa_handler)(); /* SIG DFL,SIG IGN,or add of signal handler */ 


sigset t sa mask; /* additional signals to block */ 
int sa flags; /* signal options: SA, xxx */ 
void (*sa sigaction)(int,siginfo t,void *); 


/* addr of signal handler if SA, SIGINFO set */ 

h 

规则 如 下 。 

如 果 在 sa_flags 成 员 中 设置 了 SA_SIGINFO 标 志 ， 那 么 sa_sigaction 成 员 
会 指定 信号 处 理 函 数 的 地 址 。 

如 果 在 sa_flags 成 员 中 没有 设置 SA_SIGINFO 标 志 ， 那 么 Sa_handler 成 员 
会 指定 信号 处 理 函 数 的 地 址 。 

为 给 某 个 信号 指定 默认 行为 或 忽略 该 信号 ， 应 把 sa_handler 设 置 为 
SIG_DFL 或 SIG_IGN， 并 且 不 设置 SA_SIGINFO 标 志 。 

设置 SA_SIGINFO 

8 一 17 我 们 总 是 设置 SA_SIGINFO 标 志 ， 如 果 信 和 号 不 是 SIGALRM， 那 
就 再 指定 SA_RESTART 标 志 。 


5.8 使 用 内 存 映射 /O 实 现 Posix 消 息 队 列 


我 们 现在 提供 一 个 使 用 内 存 上 映射 UO 以 及 Posix 互 不 锁 和 条 件 变 量 完成 
的 Posix 消 息 队 列 的 实现 。 


我 们 在 第 7 章 中 讨论 互 斤 锁 和 条 件 变量 ， 在 第 12 章 和 第 13 章 中 讨论 内 
存 映射 /O。 你 可 能 希望 跳 过 本 市 ， 阅 读 过 所 列 备 草 后 再 返回 来 。 

图 5-19 展 示 了 我 们 用 于 实现 Posix 消 妃 队 列 的 各 种 数据 结构 的 布局 。 该 
图 中 我 们 假设 创建 出 的 消息 队列 最 多 容纳 4 个 消息 ， 每 个 消息 7 个 字 广 。 


内 存 映 射 区 起 始 位 置 


mq_flags 
mq_maxmsg 
mq_msgsize 
mq_curmsgs 
mqh_head 
mgh free 
mqh_nwait 
mqh_pid 


mq_attr{} 


o 


mq info() 
了 
对 消息 队列 的 每 次 mq_open 
对 应 这 样 一 个 结构 


mq hdr() sigevent() mqh event 


pthread mutex t 


pthread cond t mgh wait 


msg next 
msg len 
msg prio 
7 字 节 数据 ， 
1 字 节 填充 
7 字 节 数据 ， 
1 字 节 填充 


msg hdr() 


| -个 消息 
| 一 个 消息 
上 


-个 消息 


msg hdr() 


7 字 节 数据 ， 

1 字 节 填充 

7 字 节 数据 ， 

1 字 节 填充 Snes 

: -a— 内 存 映射 区 结束 位 置 
每 个 消息 队列 对 应 一 个 内 存 映 射 文件 


图 5-19 使 用 内 存 映射 文件 实现 Posix 消 息 队列 的 各 种 数据 结构 的 布局 
图 5-20 给 出 了 我 们 的 mqueue.h 头 文件 ， 它 定义 了 本 实现 的 基本 结构 。 


msg hdr() 


msg hdr() 


my pxmsg mmap/mqueue.h 
1 typedef struct mq info *mqd t;  /* opaque datatype */ 


2 struct mq attr { 

3 long mq flags; /* message queue flag: O NONBLOCK */ 

4 long mq maxmsg; /* max number of messages allowed on queue */ 
5 long mq msgsize; /* max size of a message (in bytes) */ 

6 long mq curmsgs; /* number of messages currently on queue */ 
4 ) 

8 /* one mq hdr() per queue, at beginning of mapped file */ 

9 struct mq hdr ( 

10 struct mq attr mqh attr; /* the queue's attributes */ 

TL long mqh_head; /* index of first message */ 

12 long mqh free; /* index of first free message */ 

13 long mgh nwait; /* #threads blocked in mq receive() */ 

14 pid t mgh pid; /* nonzero PID if mgh event set */ 

15 struct sigevent mqh event;  /* for mq notify() */ 

16 pthread mutex t mgh lock; /* mutex lock */ 

17 pthread cond t mgh wait; /* and condition variable */ 

18 ) 

19 /* one msg hdr() at the front of each message in the mapped file */ 
20 struct msg hdr ( 

21 long msg next; /* index of next on linked list */ 

22 /* msg next must be first member in struct */ 

23 ssize t msg len; /* actual length */ 

24 unsigned int msg prio; /* priority */ 

25 }; 

26 /* one mq_info{} malloc'ed per process per mq_open() */ 

27 struct mq_info { 

28 struct mq hdr *mqi_hdr; /* start of mmap'ed region */ 

29 long mqi_magic; /* magic number if open */ 

30 int mqi_flags; /* flags for this process */ 

31 u 

32 #define MQI MAGIC 0x98765432 

33 /* size of message in file is rounded up for alignment */ 

34 #define MSGSIZE (i) ((((i) + sizeof (long)-1) / sizeof(long)) * sizeof (long) ) 


my_pxmsg_mmap/mqueue.h 


图 5-20 mqueue.h 头 文件 


mdqd_t 数 据 类 型 

1 我们 的 消息 队列 描述 符 只 是 一 个 指 回 某 个 BUE 。 每 次 
调用 mq_open 都 会 分 配 一 个 这 种 结构 ， 其 指针 束 返 回 给 调用 者 。 这 一 点 再 
Posix 要 求 是 这 种 数据 类 型 不 能 是 一 个 数组 类 型 。 

mq_hdr 结 构 

8 一 18 该 结构 出 现在 映 寻 文件 的 开头 ， 售 有 针对 每 个 队列 的 所 有 信 
息 。mq_attr 结 构 的 mq_flags 成 员 没 有 用 上 ， 因 为 标志 (唯一 定义 了 的 是 非 
阻塞 标志 ) 必须 以 每 次 打开 为 基 而 不 是 以 每 个 队列 为 基 来 维护 。 也 就 是 


说 ， 标 志 在 mq_info 结 构 中 维护 。 该 结构 的 其 余 成 员 随 它们 在 各 种 函数 中 的 
使 用 而 说 明 。 

现在 开始 注意 ， 我 们 称 之 为 索引 (index) 的 任何 东西 (本 结构 的 
mqh_head 和 mqh_free 成 员 ， 下 一 个 结构 的 msg_next 成 员 ) 都 含有 从 映射 文 
件 头 开始 的 字 节 索引 。 举 例 来 说 ，Solaris 2.6 下 mq_hdr 结 构 的 大 小 为 96 字 
他 ， 因 此 该 首部 之 后 第 一 个 消息 的 索引 为 96。 图 5-19 中 的 每 个 消息 占据 20 
字 节 〈12 字 节 的 msg_hdr 结 构 和 8 字 世 的 消息 数据 ) ， 因 此 其 余 三 个 消息 的 
索引 分 别 为 116、136 和 156， 该 映射 文件 的 大 小 为 176 字 节 。 这 些 索 引用 于 
维护 映射 文件 中 的 两 个 链表 :一 个 链表 (mqh head) 含有 当前 在 队列 中 的 
所 有 消息 ， 另 一 个 链表 (mqh fre) 含有 队列 中 的 所 有 空间 消息 。 我 们 不 
能 给 这 些 链 表 指 针 使 用 真正 的 内 存 指针 (地 址 ) ， 因 为 同一 映射 文件 在 映 
射 它 的 各 个 进程 中 可 以 在 不 同 的 内 存 地 址 开始 (如 图 13-6 所 示 ) ° 

msg_hdr 结 构 

19~25 该 结构 出 现在 映射 文件 中 每 个 消息 的 开头 。 所 有 消息 要 么 在 消 
息 链 表 中 ， 要 么 在 空闲 链表 中 ，msg_next 成 员 合 有 本 链表 中 下 一 个 消息 的 
索引 (如 果 本 消息 为 所 在 链表 最 后 一 个 消息 ， 那 么 下 一 个 消息 的 索引 为 
0) 。msg_len 是 消息 数据 的 真正 长 度 ， 对 于 图 5-19 中 的 例子 来 说 ， 它 可 以 
在 0~7 字 节 之 间 (包括 0 和 7) 。msg_prio 是 由 mq_send 的 调用 者 赋予 消息 的 
优先 级 。 

mq_info 结 构 

26~32 每 次 打开 一 个 队列 时 ，mq_open 会 动态 分 配 一 个 这 种 结构 ， 它 
由 mq_close 释 放 。 

mqi hdr 指 向 映射 文件 〈 由 mmap 返 回 的 起 始 地 址 ) 。 我 们 的 实现 中 的 
基本 数据 类 型 mqd_t 束 是 指 癌 该 结构 的 指针 ， 该 指针 是 mq_open 的 返回 值 。 

一 旦 mq_info 结 构 初 始 化 ， 其 mqi_magic 成 员 便 含 有 MQL MAGIC， 被 
传递 以 一 个 mdqd_t 指 针 的 每 个 函数 都 检查 该 成 员 ， 以 确信 该 指针 确实 指 回 
一 个 mq_info 结 构 。mdqi_flags 成 员 舍 有 当前 队列 的 本 次 打开 实例 的 非 阻塞 标 
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33~34 为 了 对 齐 ， 我 们 和 希望 映射 文件 中 的 每 个 消息 从 一 个 长 整数 边界 
开始 。 因 此 ， 如 果 每 个 消息 的 最 大 大 小 不 是 这 样 对 齐 的 ， 我 们 就 得 给 每 个 
消息 的 数据 部 分 增加 1~3 个 填充 字 世 ， 如 图 5-19 所 示 。 这 里 假设 长 整数 的 
大 小 为 4 字 市 (对 于 Solaris 2.6 来 说 是 正确 的 ) ， 但 是 如 果 长 整数 的 大 小 为 8 
字 (Digit Unix 4.0 上 就 是 这 样 ) ， 那 么 填充 字 节 数 在 1~7 之 间 。 

5.8.1 mq_open 图 数 

图 5-21 给 出 了 mq_open 芳 数 的 第 一 部 分 ， 它 创建 一 个 新 消 恩 队列 或 打 
开 一 个 已 存在 的 消息 队列 。 

处 理 可 变 长 度 参 数 表 

29 — 32 本 函数 能 够 以 两 个 或 四 个 参数 调用 ， 这 取决 于 是 否 指定 了 
O_CREAT 标 志 。 当 指定 了 该 标志 时 ， 第 三 个 参数 的 类 型 为 mode_t， 它 是 一 
个 基本 的 系统 数据 类 型 ， 可 以 是 任意 类 型 的 整数 。 我 们 遇 到 的 问题 是 在 
BSD/OS 上， 它 把 该 数据 类 型 定义 为 unsigned short 整 数 (占据 16 位 ) 。 既 然 
该 实现 上 的 整数 要 占据 32 位 ， 而 且 参 数 表 中 的 所 有 短 整 数 都 被 扩展 成 整 
数 ， 那 么 C 编 译 需 会 把 这 种 类 型 的 参数 从 16 位 扩展 到 32 位 。 但 是 如 果 在 
va_arg 调 用 中 指定 mode_t， 那 它 将 会 在 栈 中 走 过 16 位 后 便 指 向 下 一 个 参 
数 ， 然 而 本 参数 已 被 扩展 为 占据 32 位 。 为 此 我 们 必须 定义 自己 的 数据 类 型 
va mode t， 它 在 BSD/OS 下 是 整数 ， 在 其 他 系统 下 是 类 型 mode_ t。 我 们 的 
unpipc.h 头 文件 〈 图 C-1) 中 的 如 下 各 行 处 理 这 个 移植 性 问题 : 

#ifdef . bsdi . 


#define va mode t int 


#define va mode t mode t 

#else 

#Hendif 

30 我 们 关 掉 mode 变 量 中 的 用 户 执行 位 (S_IXUSR) ， 其 原因 稍 后 解 


my pxmsg mmap/mq open.c 
1 #include "unpipc.h" 
2 #include "mqueue.h" 


3 #include «stdarg.h» 
4 #define MAX TRIES 10 /* for waiting for initialization */ 


5 struct mq attr  defattr - 
6 ( 0, 128, 1024, 0 ); 


7 mgd t 
8 mq open(const char *pathname, int oflag, ...) 


9 { 


10 int i, fd, nonblock, created, save_errno; 

a long msgsize, filesize, index; 

12 va_list ap; 

13 mode t mode; 

14 int8 t *mptr; 

15 struct stat statbuff; 

16 struct mq hdr *mghdr ; 

17 struct msg hdr *msghdr; 

18 struct mq attr  *attr; 

19 struct mq info  *mginfo; 

20 pthread mutexattr t mattr; 

21 pthread condattr t cattr; 

22 created - 0; 

23 nonblock - oflag & O NONBLOCK; 

24 oflag &- -O NONBLOCK; 

25 mptr = (int8 t *) MAP FAILED; 

26 mginfo - NULL; 

27 again: 

28 if (oflag & O CREAT) { 

29 va start(ap, oflag); /* init ap to final named argument */ 
30 mode - va arg(ap, va mode t) & -S IXUSR; 

31 attr - va arg(ap, struct mq attr *); 

32 va end(ap); 

33 /* open and specify O EXCL and user-execute */ 
34 fd - open(pathname, oflag | O EXCL | O RDWR, mode | S IXUSR); 
35 if (fd « 0) { 

36 if (errno == EEXIST && (oflag & O EXCL) == 0) 
37 goto exists; /* already exists, OK */ 
38 else 

39 return((mgd t) -1); 

40 ) 

41 created - 1; 

42 /* first one to create the file initializes it */ 
43 if (attr -- NULL) 

44 attr - &defattr; 

45 else { 

46 if (attr-»mq maxmsg <= 0 || attr-»mq msgsize <= 0) { 
47 errno - EINVAL; 

48 goto err; 

49 ) 

50 ) 


my pxmsg mmap/mq open.c 


图 5-21 mq_open 函 数 : 第 一 部 分 
创建 一 个 新 消息 队列 
33~34 按照 由 调用 者 指定 的 名 字 创 建 一 个 普通 文件 ， 并 打开 它 的 用 户 
执行 位 。 


处 理 潜 在 的 竞争 状态 

357-40 要 是 我 们 只 是 打开 该 文件 ， 内 存 映 射 其 内 容 ， 并 在 调用 者 指定 
O_CREAT 标 志 的 前 提 下 初始 化 映射 文件 (如 稍 后 所 述 ) ， 就 会 伴 到 一 个 竞 
争 状态 。 一 个 消息 队列 只 在 调用 者 指定 了 O_CREAT 标 志 并 且 该 消息 队列 原 
本 不 存在 时 才 会 由 mq_open 初 始 化 。 这 意味 着 我 们 需要 某 种 方法 来 检测 消 
息 队 列 是 否 存 在 。 为 此 我 们 总 是 在 open 由 调用 者 给 定 的 内 存 映射 文件 时 指 
定 O_EXCL 标 志 。 但 是 只 有 调用 者 指定 了 O_EXCL 标 志 时 ， 来 自 open 的 
EEXIST 出 错 返 回 才 会 成 为 出 自 mq_open 的 错误 。 否 则 ， 如 果 open 返 回 一 个 
EEXIST 错 误 ， 那 说 明 由 调用 者 给 定 的 文件 已 经 存在 ， 我 们 就 同 前 跳 到 图 5- 
23， 仿 佛 未 曾 指定 过 O_CREAT 标 志 。 

可 能 出 现 竞 争 状 态 是 因为 使 用 一 个 内 存 映 映 文件 代表 一 个 消息 队列 需 
BED PRK A oa tL SIE ES: 首先 必须 使 用 open 创 建 该 文件 ， 
其 次 必须 初始 化 该 文件 的 内 容 ( 稍 后 描述 ) 。 如 果 有 两 个 线程 (可 以 在 同 
一 进程 或 不 同 进程 中 ) 几乎 同时 调用 mdq_open， 问 题 就 会 发 生 。 一 个 线程 
创建 该 文件 ， 然 后 系统 在 该 线程 完成 初始 化 之 前 切换 到 第 二 个 线程 。 第 二 
个 线程 检测 到 该 文件 已 存在 (使 用 O_EXCL 标 志 open) ， 于 是 立即 党 试 使 
用 该 消息 队列 。 不 过 只 有 在 第 一 个 线程 初始 化 消息 队列 后 ， 它 才能 被 使 
用 。 

我 们 使 用 该 文件 的 用 户 执 行 位 来 指示 该 消息 队列 尚未 初始 化 。 该 位 只 
能 由 真正 创建 该 文件 的 线程 启用 (使 用 O_EXCL 标 志 检 测 是 否 由 本 线程 创 
建 了 该 文件 ) ， 这 个 线程 随后 初始 化 该 消息 队列 ， 并 关 掉 用 户 执 行 位 。 我 
们 在 图 10-43 和 图 10-52 中 还 将 遇 到 类 似 的 竞争 状态 。 

检查 属性 

42~50 如 有 果 调 用 者 给 mq_open 的 最 后 一 个 参数 指定 了 一 个 空 指针 ， 我 
们 惑 使 用 图 5-21 开 始 处 给 出 的 默认 属性 128 个 消息 ， 每 个 消息 1024 字 节 。 
如 果 调 用 者 指定 了 属性 ， 我 们 就 验证 mq_maxmsg 和 mq_msgsize 为 正 数 。 

mq_open 芳 数 的 第 二 部 分 在 图 5-22 中 给 出 ;， 它 完成 一 个 新 队列 的 初始 
化 。 
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my pxmsg mmap/mq open.c 


/* calculate and set the file size */ 
msgsize - MSGSIZE(attr-»mq msgsize); 
filesize = sizeof(struct mq hdr) + (attr-»mq maxmsg * 
(sizeof(struct msg hdr) + msgsize)); 


if (lseek(fd, filesize - 1, SEEK SET) -- -1) 
goto err; 

if (write(fd, "":1) zz 1) 
goto err; 


/* memory map the file */ 
mptr - mmap(NULL, filesize, PROT READ | PROT WRITE, 
MAP SHARED, fd, 0); 
if (mptr -- MAP FAILED) 
goto err; 


/* allocate one mq info() for the queue */ 
if ( (mginfo - malloc(sizeof(struct mq info))) -- NULL) 
goto err; 


图 5-22 mq_open 函 数 第 二 部 分 : 完成 新 队列 的 初始 化 


67 mqinfo->mqi_hdr = mghdr = (struct mq hdr *) mptr; 


68 mqinfo-»mqi magic = MQI MAGIC; 
69 mginfo-»mgi flags = nonblock; 
70 /* initialize header at beginning of file */ 
AL. /* create free list with all messages on it */ 
72 mghdr-»mgh attr.mq flags = 0; 
73 mghdr-»mqh attr.mq maxmsg = attr-»mq maxmsg; 
74 mqghdr-»mgh attr.mq msgsize = attr-»mq msgsize; 
75 mghdr-»mqh attr.mq curmsgs = 0; 
76 mghdr-»mqh nwait = 0; 
gu mghdr-»mgh pid - 0; 
78 mghdr-»mgh head - 0; 
79 index = sizeof (struct mq hdr); 
80 mghdr->mgh free = index; 
81 for (i = 0; i < attr->mq_maxmsg - 1; i++) { 
82 msghdr = (struct msg hdr *) &mptr [index]; 
83 index += sizeof(struct msg hdr) + msgsize; 
84 msghdr-»msg next - index; 
85 } 
86 msghdr = (struct msg_hdr *) &mptr [index] ; 
87 msghdr-»msg next = 0; /* end of free list */ 
88 /* initialize mutex & condition variable */ 
89 if ( (i = pthread mutexattr init(&mattr)) != 0) 
90 goto pthreaderr; 
91 pthread mutexattr setpshared(&mattr, PTHREAD PROCESS SHARED); 
92 i = pthread mutex init(&mqhdr-»mgh lock, &mattr) ; 
93 pthread mutexattr destroy(&mattr); /* be sure to destroy */ 
94 XB (QD 12 0) 
95 goto pthreaderr; 
96 if ( (i = pthread condattr init(&cattr)) != 0) 
97 goto pthreaderr; 
98 pthread condattr setpshared(&cattr, PTHREAD PROCESS SHARED); 
99 i - pthread cond init(&mghdr-»mgh wait, &cattr); 
100 pthread condattr destroy (&cattr) ; /* be sure to destroy */ 
101 t£ UC te 0) 
102 goto pthreaderr; 
103 /* initialization complete, turn off user-execute bit */ 
104 if (fchmod(fd, mode) == -1) 
105 goto err; 
106 close (fd); 
107 return((mgd t) mqinfo) ; 
108 } 
my pxmsg mmap/mq open.c 
图 5-22 (4) 


设置 文件 大 小 

517-58 计算 每 个 消息 的 大 小 ， 并 向 上 舍 入 到 下 一 个 长 整数 大 小 的 倍 
数 。 计 算 文 件 大 小 时 会 将 在 该 文件 开头 分 配 的 mq_hdr 结 构 和 在 每 个 消息 开 
头 分 配 的 msg_hdr 结 构 所 占 的 空间 包括 在 内 (图 5-19) 。 使 用 lseek 设 置 新 创 
建文 件 的 大 小 ， 然 后 往 当 前 读 写 位 置 写 入 字 节 0。 


只 调用 ftruncate (13.377) 会 更 容易 些 ， 但 是 我 们 不 能 保证 它 可 用 来 增 
攻 一 个 文件 的 天 四 

内 存 映射 该 文件 

59—-63 使 用 mmap 内 存 映射 该 文件 。 

分 配 mq_info 结 构 

64~66 我 们 给 mq_open 的 每 次 调用 分 配 一 个 mq_info 结 构 。 然 后 初始 化 
该 结构 。 

初始 化 mq_hdr 结 构 

67~68 初始 化 mdq_hdr 结 构 。 设 置 消息 链表 的 头 (mqh head) 为 0， 把 
队列 中 所 有 消息 加 到 空闲 链表 (mgh_free) 中 。 

初始 化 互 斥 锁 和 条 件 变量 

88~ 102 既然 只 要 知道 一 个 Posix 消 息 队 列 的 名 字 并 具有 足够 的 权限 ， 
任何 进程 都 能 共享 它 ， 那 么 我 们 必须 以 PTHEAD_PROCESS_SHARED 属 性 
初始 化 互 不 锁 和 条 件 变 量 。 为 此 我 们 首先 调用 pthread_mutexattr_init 初 始 化 
一 个 互 斥 锁 属 性 结构 ， 再 调用 pthread_mnutexattr_setpshared 在 该 结构 中 设置 
进程 间 共 享 属 性 ， 然 后 调用 pthread_mutex_init 初 始 化 互 斥 锁 。 对 于 条 件 变 
量 也 完成 几乎 同样 的 步骤 。 我 们 要 小 心地 扶 毁 初始 化 了 的 互 斥 锁 属 性 或 条 
件 变量 属性 ， 即 使 发 生 错 误 也 这 样 ， 因 为 调用 pthread_mnutexattr_init 或 
pthread_condattr_init 可 能 分 配 了 内 存 空 间 (习题 7.3) e 

关 掉 用 户 执 行 位 

103~107 一 旦 消息 队列 已 初始 化 ， 我 们 就 关 挥 用 户 执行 位 。 这 样 指示 
消息 队列 已 初始 化 完毕 。 

我 们 还 close 已 内 存 映 射 的 文件 ， 因 为 映射 到 内 存 后 束 没 有 必要 让 它 继 
续 打 开 着 (这 样 会 占用 一 个 描述 符 ) 。 

图 5-23 给 出 了 mq_open 芳 数 的 最 后 一 部 分 ， 它 打开 一 个 已 存在 的 队 
列 。 

打开 已 存在 的 消息 队列 


109~115 我 们 是 在 O_CREAT 标 志 未 指定 或 O CREAT 指 定 了 但 消息 队 
列 已 存在 的 条 件 下 到 达 这 里 的 。 这 两 种 情况 下 ， 我 们 将 打开 一 个 已 存在 的 
消息 队列 。 我 们 open 含 有 该 消息 队列 的 文件 来 读 写 ， 并 使 用 mmap 把 该 文 
件 内 存 映 射 到 当前 进程 的 地 址 空间 中 。 

就 打开 模式 而 言 ， 我 们 的 实现 简化 了 。 即 使 调用 者 指定 了 
O_RDONLY， 我 们 也 必须 给 open 和 mmap 指 定 读 写 访问 ， 因 为 不 可 能 从 一 
个 队列 中 读 出 一 个 消息 而 不 改变 该 队列 所 在 的 内 存 映射 文件 。 同 样 地 ， 我 
们 不 可 能 往 一 个 队列 中 写 入 一 个 消息 而 不 读 其 内 存 映射 文件 。 解 决 这 个 问 
题 的 方法 之 一 是 在 mq_info 结 构 中 保存 打开 模式 (O_RDONLY ^ 
O_WRONLY 或 O0 RDWR) ， 然 后 在 各 个 函数 中 检查 这 个 模式 。 例 如 ， 如 
果 打 开 模 式 是 O_WRONLY，mq_receive 就 应 该 失败 。 

验证 消息 队列 已 初始 化 

1167-132 我 们 必须 等 竺 消息 队列 的 初始 化 (以 防 多 个 线程 几乎 同时 党 
试 创建 同一 个 消息 队列 ) 。 为 此 我 们 调用 stat 查 看 内 存 映射 文件 的 权限 

(stat 结 构 的 st_mode 成 员 ) 。 如 果 用 户 执行 位 已 关 掉 ， 那 么 消息 队列 已 被 
初始 化 。 

这 上 段 代 码 还 处 理 另 外 一 个 可 能 的 竞争 状态 。 假 设 不 同 进程 中 的 两 个 线 
程 几乎 同时 打开 同一 个 消息 队列 。 第 一 个 线程 创建 了 由 调用 者 给 定 的 文件 
后 阻塞 在 图 5-22 中 的 lseek 调 用 中 。 第 二 个 线程 发 现 该 文件 已 存在 ， 于 是 跳 
转 到 exists 标 号 处 ， 在 那儿 它 再 次 打开 文件 ， 然 后 阻塞 。 第 一 个 线程 再 次 运 
行 ， 然 而 它 在 图 5-22 中 的 mmap 调 用 失败 (也 许 是 因为 它 超过 了 自己 的 虚拟 
内 存 限制 ) ， 于 是 跳 转 到 err 标 号 处 unlink 自 己 创建 的 文件 。 第 二 个 线程 继 
续 运 行 ， 然 而 要 是 我 们 调用 fstat 而 不 是 stat 的 话 ， 该 线程 就 可 能 在 等 待 该 文 
件 初始 化 的 for 循 环 中 超时 。 于 是 我 们 改 为 调用 stat， 而 且 如 果 它 返回 一 个 
文件 不 存在 的 错误 ， 同 时 O_CREAT 标 志 已 指定 ， 那 么 我 们 跳 转 到 again 标 
号 处 (图 5-21) 以 再 次 创建 该 文件 。 这 种 可 能 的 竞争 状态 也 是 我 们 在 open 
调用 中 检查 ENOENT 错 误 的 原因 。 


my pxmsg mmap/mq open.c 


109 exists: 


110 /* open the file then memory map */ 

TII if ( (fd = open(pathname, O RDWR)) < O) ( 
112 if (errno -- ENOENT && (oflag & O CREAT)) 
113 goto again; 

114 goto err; 

115 ) 

116 /* make certain initialization is complete */ 
117 for (i = 0; i « MAX TRIES; i++) ( 

118 if (stat(pathname, &statbuff) == -1) { 
119 if (errno -- ENOENT && (oflag & O CREAT)) ( 
120 close (fd); 

121 goto again; 

122 } 

123 goto err; 

124 } 

125 if ((statbuff.st_mode & S IXUSR) == 0) 
126 break; 

127 sleep (1) ; 

128 } 

129 if (i == MAX TRIES) { 

130 errno = ETIMEDOUT; 

131 goto err; 

132 } 

133 filesize = statbuff.st_size; 


134 mptr = mmap (NULL, filesize, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
135 if (mptr == MAP FAILED) 

136 goto err; 

137 close (fd) ; 


138 /* allocate one mq info() for each open */ 
139 if ( (mginfo - malloc(sizeof(struct mq info))) -- NULL) 
140 goto err; 


141 mqinfo->mqi_hdr = (struct mq hdr *) mptr; 
142 mginfo-»mqgi magic = MQI MAGIC; 
143 mginfo-»mqgi flags = nonblock; 


144 return((mgd t) mginfo); 

145 pthreaderr: 

146 errno - i; 

147 err: 

148 /* don't let following function calls change errno */ 
149 Save errno - errno; 

150 if (created) 

151 unlink (pathname) ; 

2152 if (mptr !- MAP FAILED) 

153 munmap (mptr, filesize); 
154 if (mginfo != NULL) 

155 free (mginfo); 

156 close(fd); 

157 errno - save errno; 

158 return((mgd t) -1); 

159 ) 


my pxmsg mmap/mq open.c 


图 5-23 mq opn KRZR: 打开 已 存在 的 队列 
内 存 映射 文件 ， 分 配 并 初始 化 mq_info 结 构 


133-144 内 存 映射 消息 队列 所 在 文件 ， 然 后 关闭 该 文件 的 描述 符 。 
配 一 个 mq_info 结 构 并 将 其 初始 化 。 返 回 值 为 指 同 这 es RA 


的 指针 。 


处 理 错 误 

1457-158 当 在 本 函数 中 此 前 某 处 检测 到 一 个 错误 时 ， 程 序 将 跳 转 到 err 
标号 处 ， 同 时 errno 已 被 设置 成 将 由 mq_open 返 回 的 值 。 这 里 我 们 要 注意 保 
证 检测 到 错误 后 调用 的 用 于 清理 的 函数 不 影响 将 由 本 函数 返回 的 errno 值 。 

5.8.2 mq closeER2 

图 5-24 给 出 了 我 们 的 mq_close 函 数 。 


my pxmsg mmap/mq close.c 


1 include "unpipc.h" 

2 #include "mqueue.h" 

3 int 

4 mq close (mqd t mgd) 

5 { 

6 long msgsize, filesize; 

" struct mq hdr *mqhdr ; 

8 struct mq attr  *attr; 

9 struct mq info  *mginfo; 

10 mqinfo = mqd; 

11 if (mginfo-»mqi magic !- MQI MAGIC) { 

12 errno = EBADF; 

13 return (-1) ; 

14 } 

15 mqhdr = mqinfo->mqi_hdr; 

16 attr = &mghdr-»mgh attr; 

17 if (mq_notify(mqd, NULL) != 0) /* unregister calling process */ 
18 return (-1) ; 

19 msgsize = MSGSIZE(attr-»mq msgsize); 
20 filesize = sizeof(struct mq_hdr) + (attr->mq_maxmsg * 
21 (sizeof (struct msg hdr) + msgsize)); 
22 if (munmap(mginfo-»mgi hdr, filesize) == -1) 
23 return(-1); 
24 mginfo-»mgi magic = 0; /* just in case */ 
25 free (mqinfo) ; 
26 return (0) ; 
27 ) 


my_pxmsg_mmap/mq_close.c 


图 5-24 mq_close 函 数 


取得 指向 各 个 结构 的 指针 
10~16 验证 参数 的 有 效 性 后 ， 取 得 指向 内 存 映射 区 (mqhdr) 和 属性 
(在 mq_hdr 结 构 中 ) 的 指针 。 


注销 调用 进程 

17~18 调用 mq_notify 注 销 队 列 的 调用 进程 。 如 果 该 进程 已 注册 ， 它 就 
被 注销 ， 但 是 如 果 它 未 注册 过 ， 那 也 不 返回 错误 。 

撤销 内 存 区 映射 ， 释放 内 存 空间 

197-25 给 munmap 计 算 待 撤销 内 存 映 射 文件 的 大 小 ， 释 放 mq_info 结 构 
所 用 的 内 存 空 间 。 为 防止 本 函数 的 调用 者 在 该 内 存 区 被 malloc 重 用 之 前 继 
续 使 用 已 关闭 的 消息 队列 描述 符 ， 我 们 把 魔 数 设置 为 0， 这 样 我 们 的 消息 
队列 函数 以 后 将 检测 到 该 错误 。 

注意 ， 如 采 进 程 没 有 调用 mq_close 束 终止 ， 那么 进程 终止 时 发 生 同 样 
的 操作 : 内 存 映射 文件 被 撤销 映射 ， 内 存 空 间 被 释放 。 

5.8.3 mq unlinkEN2 

15-2528 Hi T Ba ]É mq. unlink, EAM RS RITE CINEMAS 
队列 相关 联 的 名 字 。 它 只 是 调用 Unix unlinkER ZA 9 


my pxmsg mmap/mq unlink.c 


1 #include "unpipc.h" 

2 #include "mqueue.h" 

3: dnt 

4 mq unlink(const char *pathname) 


[o 
一 一 


6 if (unlink(pathname) == -1) 
7 return(-1); 

8 return(0); 

9 


my pxmsg mmap/mq unlink.c 


[5-25 mq_unlink EHX 
5.8.4 mq_getattr Hal 
图 5-26 给 出 了 我 们 的 mq_getattr 函 数 ， 它 返回 调用 者 指定 的 队列 的 当前 
属性 o 


1 #include "unpipc.h" 

2 #include "mqueue.h" 

3 int 

4 mq getattr(mqd t mqd, struct mq attr *mqstat) 
5 { 

6 int n; 

7 struct mq_hdr *mqhdr ; 

8 struct mq attr  *attr; 

9 struct mq info  *mginfo; 

10 mginfo = mqd; 

35r if (mginfo-»mqi magic !- MQI MAGIC) { 
12 errno - EBADF; 

13 return (-1) ; 

14 } 

15 mghdr = mqinfo->mqi_hdr; 

16 attr = &mghdr-»mgh attr; 

LT if ( (n = pthread mutex lock(&mghdr-»mgh lock)) 
18 errno - n; 

19 return (-1) ; 

20 } 

21 mqstat-»mq flags = mqinfo->mqi_flags; 
22 mqstat-»mq maxmsg = attr-»mq maxmsg; 

23 mqstat-»mq msgsize - attr-»mq msgsize; 
24 mqstat-»mq curmsgs - attr-»mq curmsgs; 
25 pthread mutex unlock(&mghdr-»mgh lock); 
26 return(0); 

27 ) 


my pxmsg mmap/mq getattr.c 


!= 0) { 


/* per-open */ 
/* remaining three per-queue */ 


my pxmsg mmap/mq getattr.c 


图 5-26 mq getattrÉR 2X 


获取 队列 的 互 斥 锁 

17~20 在 取得 属性 前 ， 
以 侈 男 外 某 个 线程 中 途 修改 它们 。 

5.8.5 mq setattr Wal 

图 5-27 给 出 了 我 们 的 mq_setattr 函 数 ， 
属性 。 


必须 获取 由 调用 者 指定 的 消息 队列 的 互 不 锁 ， 


它 给 调用 者 指定 的 队列 设置 当前 


my pxmsg mmap/mq setattr.c 


1 #include "unpipc.h" 
2 #include "mqueue.h" 
3 int 


4 mq setattr(mqgd t mgd, const struct mq attr *mgstat, 


5 struct mq attr *omqstat) 

6 { 

7 int Lys 

8 struct mq hdr *mqhdr ; 

9 struct mq attr  *attr; 

10 struct mq info *mqinfo; 

11 mqinfo - mqd; 

12 if (mginfo-»mgi magic != MQI MAGIC) ( 

13 errno - EBADF; 

14 return(-1); 

15 } 

16 mqhdr = mqinfo->mqi_hdr; 

17 attr = &mghdr-»mgh attr; 

18 if ( (n = pthread_mutex_lock (&mghdr->mgh_lock)) != 0) { 
19 errno = n; 

20 return(-1); 

21 } 

22 if (omqstat != NULL) { 

23 omqstat-»mq flags = mginfo-»mgi flags;  /* previous attributes */ 
24 omqstat-»mq maxmsg = attr-»mq maxmsg; 

25 omqstat-»mq msgsize - attr-»mq msgsize; 

26 omqstat-»mq curmsgs - attr-»mq curmsgs; /* and current status */ 
27 } 

28 if (mqstat->mq_flags & O NONBLOCK) 

29 mqinfo-»mgi flags |= O NONBLOCK; 

30 else 

31 mqinfo->mqi flags &- -O NONBLOCK; 

32 pthread mutex unlock(&mqhdr-»mgh lock); 

33 return(0); 

34 } 


my pxmsg mmap/mq setattr.c 


5-27 mq setattrÉR 2 


返回 当前 属性 

22~27 如 有 果 第 三 个 参数 是 一 个 非 空 指针 ， 那 就 在 修改 属性 前 返回 先前 
的 属性 和 当前 的 状态 。 

修改 mq_flags 

28~ 31 可 使 用 本 函数 修改 的 唯一 属性 是 mq_flags ， 我 们 将 它 放 置 在 
mq_info 结 构 中 。 

5.8.6 mq notify Hal 

图 5-28 给 出 的 mq_notify 画 数 注 册 或 注销 所 指定 队列 的 调用 进程 。 我 们 
追 踩 当前 已 注册 为 接收 出 自 某 个 队列 的 通知 的 进程 ， 办 法 是 将 它 的 进程 ID 


存放 在 对 应 该 队列 的 mq_hdr 结 构 的 mgh_pid 成 员 中 。 对 于 一 个 给 定 队 列 ， 
每 次 只 有 一 个 进程 可 注册 。 当 一 个 进程 注册 自身 时 ， 它 还 把 通过 函数 参数 
指定 的 sigevent 结 构 保 存 到 mqh_event 结 构 中 。 


my pxmsg mmap/mq notify.c 


1 #include "unpipc.h" 
2 #include "mqueue.h" 
3 int 


4 mq notify(mgd t mgd, const struct sigevent *notification) 


6 int n; 

7 pidt pid; 

8 struct mq hdr *mqhdr; 

9 struct mq info *mqinfo; 

10 mqinfo = mqd; 

11 if (mqinfo->mqi magic != MQI MAGIC) { 

12 errno = EBADF; 

13 return (-1) ; 

14 } 

15 mqhdr = mqinfo->mqi_hdr; 

16 if ( (n = pthread mutex lock(&mghdr-»mqh lock)) != 0) { 
17 errno - n; 

18 return(-1); 

19 } 

20 pid = getpid(); 

21 if (notification == NULL) { 

22 if (mghdr-»mgh pid == pid) { 

23 mghdr->mgh pid = 0; /* unregister calling process */ 
24 } /* no error if caller not registered */ 
25 } else { 

26 if (mghdr-»mgh pid != 0) { 

27 if (kill(mghdr-»mgh pid, 0) != -1 || errno != ESRCH) { 
28 errno = EBUSY; 
29 goto err; 

30 } 

31 } 

2 mqhdr->mqh pid = pid; 

33 mghdr-»mqh event = *notification; 

34 ) 

35 pthread mutex unlock(&mqhdr-»mqgh lock); 

36 return(0); 

37 err: 

38 pthread mutex unlock (&mghdr-»mqgh lock); 

39 return(-1); 
40 ) 


my pxmsg mmap/mq notify.c 


图 5-28 mq. notify Ex Zt 
注销 调用 进程 
20~ 24 如 果 第 二 个 参数 是 个 空 指针 ， 那 么 注销 所 指定 队列 的 调用 进 
程 。 可 能 让 人 奇怪 的 是 ， 调 用 进程 未 曾 被 注册 接收 该 队列 的 通知 并 未 被 指 


定 为 一 种 错误 。 

注册 调用 进程 

25~34 如 果 某 个 进程 已 被 注册 ， 我 们 就 通过 向 它 发 送信 号 0 BRN 
信号 (null signal) ) 以 检查 它 是 否 仍然 存在 。 这 么 做 只 是 执行 普通 的 出 错 
检查 ， 而 不 发 送 任何 信号 ， 会 在 该 进程 不 存在 时 返回 一 个 ESRCH 错 误 。 如 
采 移 前 注册 了 的 进程 仍然 存在 ， 本 函数 就 返回 一 个 EBUSY 错 误 。 否 则 ， 保 
存 调用 进程 的 进程 ID 以 及 调用 者 的 sigevent 结 构 。 

这 里 测试 先前 注册 了 的 进程 是 否 存在 的 方法 是 不 完善 的 。 该 进程 可 能 
终止 ， 而 其 进程 ID 却 在 以 后 某 个 时 刻 被 重用 。 

5.8.7 mq send at 

15-2928 H1 T FT Amaq_send ew AVA AE BB oy © 


my pxmsg mmap/mq send.c 


1 #include "unpipc.h" 
2 #include "mqueue.h" 
3 int 
4 mq send(mqd t mqd, const char *ptr, size t len, unsigned int prio) 
5 { 
6 int n; 
7 long index, freeindex; 
8 int8 t *mptr; 
9 struct sigevent *sigev; 
10 struct mq hdr *mghdr; 
11 struct mq attr *attr; 
12 struct msg hdr *msghdr, *nmsghdr, *pmsghdr; 
13 struct mq info *mginfo; 
14 mginfo = mqd; 
15 if (mginfo-»mqi magic != MQI MAGIC) { 
16 errno - EBADF; 
17 return(-1); 
18 ) 
19 mghdr = mginfo-»mgi hdr; /* struct pointer */ 
20 mptr = (int8 t *) mghdr; /* byte pointer */ 
21 attr - &mghdr-»mgh attr; 
22 if ( (n = pthread_mutex_lock(&mghdr->mgh_lock)) != 0) { 
23 errno = n; 
24 return (-1) ; 
25 } 
26 if (len > attr-»mq msgsize) { 
27 errno = EMSGSIZE; 
28 goto err; 
29 } 
30 if (attr->mq_curmsgs == 0) { 
31 if (mghdr-»mgh pid != 0 && mghdr-»mgh nwait == 0) { 
32 sigev = &mghdr-»mgh event; 
33 if (sigev->sigev_notify == SIGEV_SIGNAL) { 
34 sigqueue (mghdr-»mgh pid, sigev->sigev_signo, 
35 sigev->sigev_value) ; 
36 
37 mqhdr->mqh pid = 0; /* unregister */ 
38 
39 } else if (attr->mq_curmsgs >= attr->mq_maxmsg) { 
40 /* queue is full */ 
41 if (mginfo-»mgi flags & O NONBLOCK) { 
42 errno - EAGAIN; 
43 goto err; 
44 } 
45 /* wait for room for one message on the queue */ 
46 while (attr->mq_curmsgs >= attr->mq_maxmsg) 
47 pthread cond wait(&mghdr-»mgh wait, &mghdr-»mgh lock); 
48 ) 


my pxmsg mmap/mq send.c 


图 5-29 mq sendERZi: 前 半 部 分 


初始 化 

14~29 取得 指向 我 们 将 使 用 的 各 个 结构 的 指针 ， 获 取 访 问 调 用 者 指定 
队列 的 互 斥 锁 。 检 碍 竺 发 送 消息 ， 确 定 其 大 小 没有 超过 该 队列 的 最 大 消息 
大 小 。 

检查 队列 是 否 为 空 ， 若 合适 则 发 送 通知 


30~38 如 有 果 是 在 往 一 个 空 队 列 中 放置 消息 ， 我 们 就 检查 是 否 有 某 个 进 
程 被 注册 为 接收 出 自 该 队列 的 通知 ， 并 检查 是 否 有 某 个 线程 阻塞 在 
mq_receive 调 用 中 。 对 于 后 面 那 种 检查 而 言 ， 我 们 将 看 到 图 5-31 和 图 5-32 中 
的 mq_receive 了 芳 数 维护 着 一 个 用 来 存放 阻塞 在 空 队 列 上 的 线程 数 的 计数 器 

(mqh nwait) 。 如 果 该 计数 器 的 值 为 非 零 ， 我 们 就 不 向 已 注册 了 的 进程 
发 送 任何 通知 。 我 们 只 处 理 SIGEV_SIGNAL 这 种 通知 方式 ， 其 信号 通过 调 
用 sigqueue 发 出 。 已 注册 了 的 进程 随后 被 注销 。 

调用 sigqueue 发 送信 号 导致 向 信号 处 理 程序 传递 的 siginfo_t 结 构 (5.7 
TT) 中 si_code 成 员 的 值 为 SI QUEUE， 这 是 不 正确 的 ， 正 确 的 值 应 为 
SLMESGQ。 从 用 户 进程 中 产生 正确 的 si_code 取 决 于 实现 。 [IEEE 1996] 
第 433 页 提 到 ， 要 从 一 个 用 户 函 数 库 中 产生 该 信号 ， 需 用 到 进入 信和 号 产生 
机 制 的 一 个 隐藏 接口 。 

检查 队列 是 否 填 满 

39—-48 如 有 果 调 用 者 指定 的 队列 已 填 满 ， 但 是 O_ NONBLOCK 标 志 已 设 
置 ， 我 们 就 返回 一 个 EAGAIN 错 误 。 否 则 ， 我 们 等 待 在 条 件 变 量 mqh_wait 
上 上， 该 条 件 变 量 由 我 们 的 mq_receive 函 数 在 从 某 个 填 满 的 队列 中 读 出 一 个 
消息 时 发 给 信号 。 

束 mq_send 调 用 在 被 某 个 由 其 调用 进程 捕获 的 信号 中 断 时 返回 一 个 
EINTR 错 误 而 言 ， 我 们 的 实现 简化 了 。 问 题 在 于 当 信 号 处 理 程序 返回 时 ， 
pthread_cond_wait 并 不 返回 一 个 错误 : 它 可 能 返回 一 个 为 0 的 值 (这 看 来 是 
次 虚假 的 唤醒 ) ， 也 可 能 根本 不 返回 。 绕 过 这 一 问题 的 方法 确实 存在 ， 但 
每 种 方法 都 不 简单 。 

图 5-30 给 出 了 mq_send 函 数 的 后 半 部 分 。 人 至 此 我 们 已 知道 调用 者 指定 
的 队列 中 有 写 入 新 消息 的 空间 。 

取得 待 用 空闲 块 的 索引 

507-52 既然 在 调用 者 指定 的 队列 初始 化 时 创建 的 空闲 消息 数 等 于 
mq_maxmsg ， 我 们 就 不 应 该 有 在 空间 链表 为 空 的 前 提 下 mq_curmsgs 小 于 
mq_maxmsg 的 状态 。 


复制 消息 

53~56 nmsghdr 舍 有 所 映射 内 存 区 中 用 于 存放 待 写 入 消息 的 位 置 的 地 
址 。 该 消息 的 优先 级 和 长 度 存放 在 它 的 msg_hdr 结 构 中 ， 其 内 容 则 从 调用 
者 空间 复制 。 

把 新 消息 置 于 链表 中 正确 位 置 

57~74 我 们 的 链表 中 各 消息 的 顺序 是 从 开始 处 (mqh head) 的 最 高 优 
完 级 到 结束 处 的 最 低 优 先 级 。 当 一 个 新 消息 加 入 调用 者 指定 的 队列 中 ， 并 
且 一 个 或 多 个 同样 优先 级 的 消息 已 在 该 队列 中 时 ， 这 个 新 消息 就 加 在 最 后 
一 个 优先 级 相同 的 消息 之 后 。 使 用 这 样 的 排序 方式 后 ，mq_receive 总 是 返 
回 链表 中 的 第 一 个 消息 ( 它 是 该 队列 上 优先 级 最 高 的 最 早 的 消息 ) 。 当 我 
们 沿 链表 行进 时 ，pmsghdr 将 含有 链表 中 上 一 个 消息 的 地 址 ， 因 为 它 的 
msg next EKRA TS AR 9] 。 

我 们 的 做 法 在 该 队列 中 有 大 量 消息 时 可 能 较 慢 ， 因 为 每 次 往 该 队列 中 
写 入 一 个 消息 时 都 得 遍历 大 量 的 链表 项 。 可 以 再 维护 一 个 索引 ， 让 它 记 住 
各 个 可 能 优先 级 的 最 后 一 个 消息 的 位 置 。 


my pxmsg mmap/mq send.c 


49 /* nmsghdr will point to new message */ 

50 if ( (freeindex = mghdr-»mgh free) == 0) 

51 err dump("mq send: curmsgs = $1d; free = 0", attr-»mq curmsgs); 
52 nmsghdr - (struct msg hdr *) &mptr[freeindex]; 

53 nmsghdr-»msg prio - prio; 

54 nmsghdr-»msg len - len; 

55 memcpy (nmsghdr + 1, ptr, len); /* copy message from caller */ 
56 mqghdr-»mgh free = nmsghdr-»msg next; /* new freelist head */ 
57 /* find right place for message in linked list */ 

58 index = mghdr-»mgh head; 

59 pmsghdr = (struct msg hdr *) &(mghdr-»mqgh head); 

60 while (index !- 0) ( 

61 msghdr - (struct msg hdr *) &mptr [index]; 

62 if (prio » msghdr-»msg prio) ( 

63 nmsghdr-»msg next - index; 

64 pmsghdr-»msg next - freeindex; 

65 break; 

66 } 

67 index = msghdr-»msg next; 

68 pmsghdr = msghdr; 

69 } 

70 if (index == 0) { 

71 /* queue was empty or new goes at end of list */ 

72 pmsghdr-»msg next = freeindex; 

73 nmsghdr-»msg next = 0; 

74 } 

75 /* wake up anyone blocked in mq_receive waiting for a message */ 
76 if (attr-»mq curmsgs == 0) 

VE pthread cond signal(&mghdr-»mgh wait); 

78 attr->mq_curmsgs++; 

79 pthread_mutex_unlock (&mghdr->mqh_lock) ; 

80 return (0) ; 

81 err: 

82 pthread_mutex_unlock (&mghdr->mqh_lock) ; 

83 return (-1) ; 

84 } 


my_pxmsg_mmap/mq_send.c 


图 5-30 mq sendEX Zi: 后 半 部 分 


唤醒 阻塞 在 mq_receive 中 的 任何 线程 

75 - 77 WAREZ AE Bi BRIAR SAS, BOT y 
pthread_cond_signal 唤 醒 可 能 阻塞 在 mq_receive 中 的 任何 线程 。 

78 给 当前 在 该 队列 中 的 消息 数 mq_curmsgs 加 1。 

5.8.8 mq_receive Hat 

5-31 给 出 了 我 们 的 mq_receive 函 数 的 前 半 部 分 ， 它 设置 所 需 的 指 
针 、 获 取 互 不 锁 ， 并 验证 调用 者 的 缓冲 区 足以 容纳 最 大 的 可 能 消息 。 

检查 队列 是 否 为 空 


30~40 如 果 由 调用 者 指定 的 队列 为 空 ， 而 且 O_NONBLOCK 标 志 已 设 
置 ， 那 天 返回 一 个 EAGAIN 错 误 。 否 则 ， 给 该 队列 的 mqh_nwait 计 数 句 加 
1， 它 由 图 5-29 中 的 mq_send 函 数 检 查 ， 检 查 前 提 是 该 队列 为 空 ， 而 且 某 个 
进程 已 注册 成 接收 该 队列 的 通知 。 然 后 等 待 在 条 件 变 量 上 ， 它 由 图 5-29 中 
的 mq_send 发 送信 号 。 


my pxmsg mmap/mq receive.c 


1 #include "unpipc.h" 

2 #include "mqueue.h" 

3 ssize t 

4 mq receive(mgd t mqd, char *ptr, size t maxlen, unsigned int *priop) 
5 { 

6 int n; 

7 long index; 

8 int8 t *mptr; 

9 ssize t len; 

10 struct mq hdr *mqhdr; 

Li struct mq attr  *attr; 

12 struct msg hdr  *msghdr; 

13 struct mq info *mqinfo; 

14 mginfo = mqd; 

15 if (mginfo-»mgi magic !- MQI MAGIC) { 

16 errno - EBADF; 

17 return(-1); 

18 } 

19 mghdr = mqinfo->mqi_hdr; /* struct pointer */ 

20 mptr = (int8 t *) mghdr; /* byte pointer */ 

21 attr = &mghdr-»mgh attr; 

22 if ( (n = pthread mutex lock(&mqhdr-»mqh lock)) != 0) { 
23 errno - n; 

24 return(-1); 

25 ) 

26 if (maxlen « attr-»mq msgsize) ( 

27 errno - EMSGSIZE; 

28 goto err; 

29 ) 

30 if (attr-»mq curmsgs == 0) { /* queue is empty */ 
31 if (mginfo-»mqi flags & O NONBLOCK) { 

32 errno - EAGAIN; 

33 goto err; 

34 ) 

35 /* wait for a message to be placed onto queue */ 
36 mqhdr->mgh_nwait++; 

37 while (attr->mq_curmsgs == 0) 

38 pthread cond wait (&mghdr->mgh_wait, &mghdr->mqh_lock) ; 
39 mghdr-»mgh nwait--; 

40 } 


my pxmsg mmap/mq receive.c 


5-31 mq receiveEA Zi: 前 半 部 分 


跟 mq_send 的 实现 一 样 ， 就 mq_receive 调 用 在 被 某 个 由 其 调用 进程 捕获 
的 信号 中 断 时 返回 一 个 EINTR 错 误 而 言 ， 我 们 的 实现 简化 了 。 

图 5-32 给 出 了 我 们 的 mq_receive 函 数 的 后 半 部 分 。 至 此 我 们 已 知道 由 
调用 者 指定 的 队列 中 有 一 个 消息 准备 返回 给 调用 者 。 

给 调用 者 返回 消息 

43~51 msghdr 指 同调 用 者 指定 队列 中 第 一 个 消息 的 msg_hdr， 它 是 我 
们 要 返回 的 。 由 该 消息 占据 的 空间 变 为 空间 链表 的 新 涉 。 

唤醒 阻塞 在 mq_send 中 的 任何 线程 

52~54 如 有 果 该 队列 在 我 们 从 中 取 走 签 读 出 消息 前 是 填 满 的 ， 我 们 就 调 
用 pthread_cond_signal， 以 防 某 个 线程 阻塞 在 mdq_send 调 用 中 等 待 一 个 消息 
的 空间 。 


my pxmsg mmap/mq receive.c 


41 if ( (index = mghdr-»mgh head) == 0) 

42 err dump("mq receive: curmsgs - $1d; head - 0", attr-»mq curmsgs); 
43 msghdr - (struct msg hdr *) &mptr[index]; 

44 mghdr-»mqh head - msghdr-»msg next; /* new head of list */ 
45 len - msghdr-»msg len; 

46 memcpy (ptr, msghdr + 1, len); /* copy the message itself */ 
47 if (priop !- NULL) 

48 *priop - msghdr-»msg prio; 

49 /* just-read message goes to front of free list */ 

50 msghdr-»msg next = mghdr-»mgh free; 

51 mqhdr-»mgh free = index; 

52 /* wake up anyone blocked in mq send waiting for room */ 
53 if (attr-»mq curmsgs -- attr-»mq maxmsg) 

54 pthread cond signal(&mqghdr-»mgh wait); 

55 attr-»mq curmsgs--; 

56 pthread mutex unlock(&mghdr-»mgh lock); 

57 return (len); 

58 err: 

59 pthread mutex unlock(&mqghdr-»mgh lock); 

60 return(-1); 

61 ) 


my pxmsg mmap/mq receive.c 


[5-32 mq receive K žt: 后 半 部 分 


5.9 小 结 


Posix 消 息 队 列 比较 简单 : mdq_open 创 建 一 个 新 队列 或 打开 一 个 已 存在 
的 队列 ，mq_close 关 闭 队 列 ，mq_unlink 则 删除 队列 名 。 往 一 个 队列 中 放置 
消息 使 用 mq_send， 从 一 个 队列 中 读 出 消息 使 用 mq_receive。 队 列 属性 的 查 
18 5j ix S Himq getattrfllmq setattr, EX 2%mqg_notify ll] TIFARE — ^ 
信和 号 或 线程 ， 它 们 在 有 一 个 消息 被 放置 到 某 个 空 队列 上 时 发 送 (信号 ) 或 
激活 CAE) 。 队 列 中 的 每 个 消息 被 赋予 一 个 小 整数 优先 级 ，mdq_receive 
每 次 被 调用 时 总 是 返回 最 高 优先 级 的 最 早 消息 。 

rnq_notify 的 使 用 给 我 们 引入 了 Posix 实 时 信号 ， 它 们 在 SIGRTMIN 和 
SIGRTMAX 之 间 。 当 设置 SA_SIGINFO 标 志 来 安装 这 些 信 号 的 处 理 程序 
时 ， (1) 这 些 信 号 是 排队 的 ， (2) 排 了 队 的 信和 号 是 以 FIFO 顺 序 递 交 的 ， 

(3) 给 信号 处 理 程序 传递 两 个 额外 的 参数 。 

最 后 ， 我 们 使 用 内 存 映 射 IO 以 及 一 个 Posix 互 不 锁 和 一 个 Posix 条 件 变 
量 ， 以 约 500 行 C 代 码 实现 了 Posix 消 息 队 列 的 大 多 数 特 性 。 该 实现 展示 了 处 
理 新 队列 的 创建 中 存在 的 一 个 竞争 状态 ， 我 们 在 第 10 章 中 实现 Posix 信 和 号 量 
时 将 遇 到 同样 的 竞争 状态 。 


习题 


5.1 在 介绍 图 5-5 时 我 们 说 过 ， 当 创建 新 队列 时 ， 如 果 mq_open 的 attr 参 
数 非 室 ， 那 么 nmq_maxmsg 和 mq_msgsize 两 个 成 员 都 必须 指定 。 怎 么 做 才能 
允许 我 们 只 指定 其 中 的 一 个 成 员 ， 而 未 指定 的 那个 成 员 则 采用 系统 的 默认 
值 ? 

5.2 修改 图 5-9 中 的 程序 ， 使 得 所 讨论 的 信号 在 递交 之 时 并 不 调用 
mq_notify。 然 后 往 相应 的 队列 发 送 两 个 消息 ， 验 证 对 应 第 二 个 消息 的 信和 号 
没有 产生 。 为 什么 ? 

5.3 修改 图 5-9 中 的 程序 ， 使 得 所 讨论 的 信号 在 递交 之 时 并 不 从 相应 队 
列 中 读 出 消息 。 相 反 ， 处 理 程序 只 是 调用 mq_notify 并 输出 接收 到 的 信号。 
然后 往 该 队列 发 送 两 个 消息 ， 验 证 对 应 第 二 个 消息 的 信号 没有 产生 。 为 什 
AA? 


5.4 在 图 5-17 的 第 一 个 printf 中 ， 如 果 我 们 把 那 两 个 常 值 向 整数 的 类 型 
强制 转换 去 掉 ， 那 么 会 发 生 什 么 情况 ? 

5.5 如 下 修改 图 5-5 中 的 程序 : 在 调用 mq_open 之 前 ， 输 出 一 个 消息 并 
sleep 30 秒 。 在 mdq_open 返 回 之 后 ， 输 出 另 一 个 消息 ，sleep 30 秒 ， 然 后 调用 
mq_close。 编 译 并 运行 该 程序 ， 指 定 一 个 较 大 的 消息 数 〈 几 十 万 个 ) ， 最 
大 消息 大 小 则 CER) 为 10 字 节 。 其 目的 是 创建 一 个 大 消息 队列 GRE 
万 字 节 大 小 ) ， 然 后 查看 消息 队列 的 实现 是 否 使 用 内 存 映射 文件 。 在 第 一 
个 30 秒 停顿 期 间 ， 运 行 一 个 诸如 ps 这 样 的 程序 ， 看 一 看 修改 后 程序 的 内 存 
大 小 。mdq_open 返 回 后 再 做 一 届 。 你 能 解释 所 发 生 的 情况 吗 ? 

5.6 当 mq_send 的 调用 者 指定 一 个 0 长 度 时 ， 图 5-30 中 的 memcpy 调 用 会 
发 生 什么 ? 

5.7 此 较 消息 队列 和 4.4 节 讲述 的 全 双 工 管道 。 父 子 进程 之 间 的 双向 通 
信和 需 多 少 个 消息 队列 ? 

5.8 图 5-24 中 我 们 为 什么 不 摧毁 互 斥 锁 和 条 件 变 量 ? 

5.9 Posix 说 消息 队列 描述 符 不 能 是 数组 类 型 。 为 什么 ? 

5.10 图 5-14 中 的 main 函 数 在 哪儿 花费 大 部 分 时 间 ? 每 次 递交 一 个 信和 号 
后 发 生 什么 ?我们 如 何 处 理 这 种 情形 ? 

5.11 REM RSH BRA MMAR BY 
PTHREAD_PROCESS_SHARED 属 性 。 重 新 编写 5.8 节 中 Posix 消 息 队 列 的 实 
现 ， 使 用 Posix 信 号 量 (第 10 章 ) 代替 互 斥 锁 和 条 件 变量 。 

5.12 把 5.8 节 中 Posix 消 息 队 列 的 实现 扩展 成 文 持 SIGEV_THREAD ° 


第 6 章 System V 消 息 队列 
6.1 概述 


System V 消 息 队 列 使 用 消息 队列 标识 符 (message queue identifier) 标 
只 。 具 有 足够 特权 〈3.5 节 ) 的 任何 进程 都 可 以 往 一 个 给 定 队列 放置 一 个 消 
息 ， 具 有 足够 特权 的 任何 进程 都 可 以 从 一 个 给 定 队 列 读 出 一 个 消息 。 跟 
Posix 消 息 队 列 一 样 ， 在 某 个 进程 往 一 个 队列 中 写 入 一 个 消息 之 前 ， 不 求 另 
外 某 个 进程 正在 等 待 该 队列 上 一 个 消息 的 到 达 。 

对 于 系统 中 的 每 个 消息 队列 ， 内 核 维护 一 个 定义 在 <sys/msg.h> 头 文件 
中 的 信息 结构 。 


struct msqid ds { 


structipc perm msg perm; /* read write perms: Section 3.3 */ 

struct msg *msg first;  /* ptr to first message on queue */ 

struct msg *msg last; /* ptr to last message on queue */ 

msglen t msg cbytes; /* current £ bytes on queue */ 

msgqnum t msg qnum; /* current # of messages on 
queue */ 

msglen t msg qbytes; /* max # of bytes allowed on 
queue */ 

pid_t msg lspid;  /* pid of last msgsnd()*/ 

pid t msg lrpid;  /* pid of last msgrcv()*/ 

time t msg stime;  /* time of last msgsnd()*/ 

time t msg rtime; /* time of last msgrcv()*/ 

time t msg ctime;  /* time of last msgctl() 


(that changed the above)*/ 
ip 
Unix 98 不 要 求 有 msg_first、msg_last 和 msg_cbytes 成 员 。 然 而 普通 的 源 
H System V 的 实现 中 可 找到 这 三 个 成 员 。 很 自然 ， 将 一 个 队列 中 的 各 个 消 
奶 作 为 一 个 链表 来 维护 的 要 求 并 不 存在 ， 但 这 却 是 msg_first 和 msg_last 这 两 
个 成 员 所 隐 舍 的 。 束 算 提供 了 这 两 个 指针 ， 那 么 它们 指 疝 的 是 内 核 内 存 空 
间 ， 对 于 应 用 来 说 基本 上 没有 作用 。 


我 们 可 以 将 内 核 中 某 个 特定 的 消息 队列 画 为 一 个 消息 链表 ， 如 图 6-1 所 
示 。 假 设 有 一 个 具有 三 个 消息 的 队列 ， 消 息 长 度 分 别 为 1 字 节 、2 字 节 和 3 
字 节 ， 而 且 这 些 消息 就 是 以 这 样 的 顺序 写 入 该 队列 的 。 再 假设 这 三 个 消息 
的 类 型 (type) 分 别 为 100、200 和 300。 


msqid ds{} 


下 一 个 消息 下 一 个 消息 
类 型 =100 
ipc perm() 
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un 


msg ctime 


Elo-1 内 核 中 的 System V 消 息 队列 结构 
我 们 将 在 本 章 中 查看 操纵 System V 消 息 队 列 的 函数 ， 并 使 用 消息 队列 
实现 4.2 市 中 的 文件 服务 器 例子 。 


6.2 msgget HAL 


msgget EX a Fd F 81] && — ^P 390 0] 1H 4 DÀ, 91] Ba] — Ae C FEE RJ TRE BA 
列 。 

#include <sys/msg.h> 

int msgget(key_t key,int oflag); 

返回 : 若 成 功 则 为 非 负 标识 符 ， 若 出 错 则 为 -1 

返回 值 是 一 个 整数 标识 符 ， 其 他 三 个 msg 画 数 就 用 它 来 指 代 该 队列 。 
它 是 基于 指定 的 key 产 生 的 ， 而 key 既 可 以 是 ftok 的 返回 值 ， 也 可 以 是 常 值 
IPC_PRIVATE， 如 图 3-3 所 示 。 

oflag 是 图 3-6 中 所 示 的 读 写 权限 值 的 组 合 。 它 还 可 以 与 IPC_CREAT 或 
IPC_CREATIIPC_EXCL 按 位 或 ， 如 随 图 3-4 的 讨论 所 述 。 


当 创建 一 个 新 消息 队列 时 ，msqid_ds 结 构 的 如 下 成 员 被 初始 化 。 

msg_perm 结 构 的 uid 和 cuid 成 员 被 设置 成 当前 进程 的 有 致 用 户 ID gid 
和 cgid 成 员 被 设置 成 当前 进程 的 有 效 组 ID。 

oflag 中 的 读 写 权 限 位 存放 在 msg_perm.mode 中 。 

msg_qnum、masg_lspid、msg_lrpid、msg_stime 和 msg_rtime 被 置 为 0。 

msg_ctime 被 设置 成 当前 时 间 。 

msg_qbytes 被 设置 成 系统 限制 值 。 


6.3 msgsnd ER Zt 
使 用 msgget 打 开 一 个 消息 队列 后 ， 我 们 使 用 msgsnd 往 其 上 放置 一 个 消 


#include <sys/msg.h> 
int msgsnd(int msqid,const void *ptr,size t length,int flag); 
返回 : 者 成 功 则 为 0， 大 出 错 则 为 -1 

其 中 msqid 是 由 msgget 返 回 的 标识 行 。ptr 是 一 个 结构 指针 ， 该 结构 具 
有 如 下 的 模板 ， 它 定义 在 <sys/msg.h> 中 。 

struct msgbuf { 

long mtype; /* message type,must be > 0 */ 

char mtext[1]; /* message data */ 

F 
消息 类 型 必须 大 于 0， 因 为 对 于 msgrcv 函 数 来 说 ， 非 正 的 消息 类 型 用 
作 特殊 的 指示 器 ， 我 们 将 在 下 一 节 讲 述 。 

msgbuf 结 构 定 义 中 的 名 字 mtext 不 大 确切 ， 消 息 的 数据 部 分 并 不 局 限于 
文本 。 任 何 形 式 的 数据 都 是 允许 的 ， 无 论 是 二 进 制 数 据 还 是 文本 。 内 核 根 
本 不 解释 消 乱 数据 的 内 容 。 

我 们 使 用 “模板 ”的 说 法 描述 这 个 结构 ， 因 为 ptr 所 指 癌 的 只 是 一 个 含有 
消息 类 型 的 长 整数 ， 消 息 本 吴 则 紧 跟 在 它 之 后 (如 果 消 息 长 度 大 于 0 字 
T) 。 不 过 大 多 数 应 用 并 不 使 用 ms_gbuf 结 构 的 这 个 定义 ， 因 为 其 数据 量 


(1 个 字 节 ) 通常 是 不 够 的 。 一 个 消息 中 的 数据 量 并 不 存在 编译 时 限制 
(其 系统 限制 则 通常 可 由 系统 管理 员 修改 ) ， 因 此 可 不 去 声明 一 个 数据 量 
很 大 ( 比 一 个 给 定 应 用 可 能 支持 的 数据 还 要 大 ) 的 结构 ， 而 去 定义 一 个 上 
述 的 模板 。 大 多 数 应 用 然后 定义 自己 的 消息 结构 ， 其 数据 部 分 根据 应 用 的 
举例 来 说 ， 如 果 某 个 应 用 需要 交换 由 一 个 16 位 整数 后 跟 一 个 8 字 市 字 
符 数 组 构成 的 消息 ， 那 它 可 以 定义 自己 的 结构 如 下 : 
#define MY_DATA 8 
typedef struct my_msgbuf { 


long mtype; /* message type */ 
int16 t mshort; /* start of message data */ 
char mchar[MY DATA]; 

} Message; 


msgsndB length Zi Ll T Ay E Br TR AE REC TH WIRE o DUET. 
长 整数 消息 类 型 之 后 的 用 户 目 定义 数据 的 长 度 。 该 长 度 可 以 是 0。 在 刚刚 
给 出 的 例子 中 ， 长 度 可 以 传递 成 sizeof (Message)- sizeof(long) ° 

flag 参 数 既 可 以 是 0， 也 可 以 是 IPC_NOWAIT。IPC_NOWAIT 标 志 使 得 
msgsnd 调 用 非 阻 塞 (nonblocking) : 如 果 没 有 存放 新 消息 的 可 用 空间 ， 该 
函数 束 马 上 返回 。 这 个 条 件 可 能 发 生 的 情形 包括 : 

在 指定 的 队列 中 已 有 太 多 的 字 节 〈 对 应 该 队列 的 msqid_ds 结 构 中 的 
msg qbytesf) ; 

在 系统 范围 存在 太 多 的 消息 。 

如 果 这 两 个 条 件 中 有 一 个 存在 ， 而 且 IPC_NOWAIT 标 志 已 指定 ， 
msgsnd 束 返回 一 个 EAGAIN 错 误 。 如 采 这 两 个 条 件 中 有 一 个 存在 ， 但 是 
IPC_NOWAIT 标 志 未 指定， 那么 调用 线程 被 投入 睡眠 ， 直 到 |: 

具备 存放 新 消息 的 空间 ; 

由 msqid 标 识 的 消息 队列 从 系统 中 删除 (这 种 情况 下 返回 一 个 EIDRM 


HIE) ; 


调用 线程 被 某 个 捕获 的 信号 所 中 断 (这 种 情况 下 返回 一 个 EINTR 错 


6.4 msercv Hat 
(E H msgrev EN BUM SE-B BDA FF E EH — 1 TH Js, o 


#include <sys/msg.h> 
ssize_t msgrcv(int msqid,void *ptr,size_t length,long type, int flag); 
返回 : 若 成 功 则 为 读 入 缓冲 区 中 数据 的 字 节 数 ， 若 
出 错 则 为 -1 

其 中 ptr 参 数 指定 所 接收 消息 的 存放 位 置 。 跟 msgsnd 一 样 ， 该 指针 指 辐 
紧 挨 在 真正 的 消息 数据 之 前 返回 的 长 整数 类 型 字段 (图 4-26) 。 

length 指 定 了 由 ptr 指 向 的 缓冲 区 中 数据 部 分 的 大 小 。 这 是 该 贸 数 能 返 
回 的 最 大 数据 量 。 该 长 度 不 包括 长 整数 类 型 字段 。 

type 指 定 希 望 从 所 给 定 的 队列 中 读 出 什么 样 的 消 乱 。 

如 果 type 为 0， 那 束 返 回 该 队列 中 的 第 一 个 消 妃 。 有 既然 每 个 消 忌 队 列 都 
是 作为 一 个 FIFO (先进 先 出 ) 链表 维护 的 ， 因 此 type 为 0 指定 返回 该 队列 中 
最 早 的 消息 。 

如 果 type 大 于 0， 那 就 返回 其 类 型 值 为 type 的 第 一 个 消 轧 。 

如 果 type 小 于 0， 那 就 返回 其 类 型 值 小 于 或 等 于 type 参 数 的 绝对 值 的 消 
居中 类 型 值 最 小 的 第 一 个 消 筷 。 

考虑 图 6-1 中 所 示 的 消息 队列 例子 ， 它 含有 三 个 消 筷 : 

第 一 个 消息 的 类 型 为 100， 长 度 为 1; 

第 二 个 消息 的 类 型 为 200， 长 度 为 2; 

最 后 一 个 消息 的 类 型 为 300， 长 度 为 3。 

图 6-2 展 示 了 为 不 同 的 type 值 返回 的 消息 的 类 型 。 


所 返回 消息 的 类 型 


图 6-2 由 msgrcv 给 不 同 的 type 值 返回 的 消息 

msgrcv 的 flag 参 数 指定 所 请 求 类 型 的 消息 不 在 所 指定 的 队列 中 时 该 做 
何 处 理 。 在 没有 消息 可 得 的 情况 下 ， 如 果 设 置 了 flag 中 的 IPC_NOWAIT 
位 ，msgrcv 函 数 就 立即 返回 一 个 ENOMSG 错 误 。 和 否则 ， 调 用 者 被 阻塞 到 下 
列 某 个 事件 发 生 为 上 : 

(1) 有 一 个 所 请 求 类 型 的 消息 可 获取 ; 

(2) 由 msqid 标 识 的 消息 队列 被 从 系统 中 删除 (这 种 情况 下 返回 一 个 
EIDRM 错 误 ) ; 
(3) 调 用 线程 被 某 个 捕获 的 信号 所 中 断 (这 种 情况 下 返回 一 个 EINTR 错 


^E 


ix) 
flag 参 数 中 另 有 一 位 可 以 指定 : MSG_NOERROR。 当 所 接收 消息 的 真 
正 数据 部 分 大 于 length 参 数 时 ， 如 果 设 置 了 该 位 ，msgrcv 函 数 就 只 是 截 短 
数据 部 分 ， 而 不 返回 错误 。 否 则 ，ms_grcv 返 回 一 个 E2BIG 错 误 。 
成 功 返 回 时 ，msgrcv 返 回 的 是 所 接收 消息 中 数据 的 字 下 数 。 它 不 包括 
也 通过 ptr 参 数 返 回 的 长 整数 消息 类 型 所 需 的 几 个 字 节 。 


6.5 msgctl 函 数 


msgctl 函 数 提 供 在 一 个 消息 队列 上 的 各 种 控制 操作 。 


#include <sys/msg.h> 

int msgctl(int msqid,int cmd,struct msqid ds *buff); 

返回 : ARAN AO, AEEA- 
msgctl 函 数 提供 3 个 命令 。 

IPC_RMID 从 系统 中 删除 由 msqid 指 定 的 消 恩 队列 。 当 前 在 该 队列 上 的 
任何 消息 都 被 丢弃 。 我 们 已 在 图 3-7 中 看 到 过 这 种 操作 的 例子 。 对 于 该 命令 
而 言 ，msgctl 苹 数 的 第 三 个 参数 被 忽略 。 

IPC SET 给 所 指定 的 消息 队列 设置 其 msqid_ds 结 构 的 以 下 4 个 成 员 : 
msg_perm.uid、msg_perm.gid、msg_perm.mode 和 msg_qbytes。 它 们 的 值 来 
自由 buff 参 数 指 向 的 结构 中 的 相应 成 员 。 

IPC STAT (通过 buff 参 数 ) 给 调用 者 返回 与 所 指定 消息 队列 对 应 的 当 
前 msqid_ds 结 构 。 

例子 

图 6-3 中 的 程序 创建 一 个 消息 队列 ， 往 该 队列 中 放置 一 个 含有 1 字 Te? 
据 的 消息 ， 发 出 msgctl 的 IPC_STAT 命 令 ， 使 用 system 函 数 执行 ipcs 命 令 ， 最 
后 使 用 msgct 的 IPC_RMID 命 令 删除 该 队列 。 


VE 


svmsg/ctl.c 
1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
4 { 
5 int msqid; 
6 struct msqid ds info; 
7 struct msgbuf buf; 
8 msqid - Msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT); 
9 buf.mtype - 1; 
10 buf.mtext[0] = 1; 
EL Msgsnd (msqid, &buf, 1, 0); 
12 Msgctl(msqid, IPC STAT, &info); 
13 printf("read-write: %030, cbytes = %lu, qnum = $1lu, qbytes = %lu\n", 
14 info.msg perm.mode & 0777, (ulong t) info.msg cbytes, 
15 (ulong t) info.msg qnum, (ulong t) info.msg_qbytes) ; 
16 system("ipcs -q"); 
17 Msgctl(msqid, IPC RMID, NULL); 
18 exit (0); 
19 } 
svmsg/ctl.c 


到 6-3 使 用 msgctl 命 令 的 例子 


我 们 把 1 字 节 长 度 的 消息 写 入 所 创建 的 队列 中 ， 这 里 只 要 使 用 定义 在 
<sys/msg.h> 中 的 标准 msgbuf 结 构 就 行 了。 

执行 该 程序 的 结果 如 下 : 

solaris % ctl 

read-write: 664,cbytes = 1,qnum = 1,qbytes = 4096 

IPC status from <running system> as of Mon Oct 20 15:36:40 1997 


T ID KEY MODE OWNER 
GROUP 

Message Queues: 

q 1150 00000000 --rw-rw-r-- rstevens otherl 


这 与 预期 的 一 致 。 如 3.2 节 所 提 ，0 是 IPC_PRIVATE 键 的 共同 键 值 。 执 
行 本 例子 的 系统 上 每 个 消息 队列 有 4096 字 节 的 限制 。 既 然 我 们 写 了 一 个 1 
字 市 数据 的 消息 ， 而 且 msg_cbytes 的 值 为 1， 那 么 该 限制 显然 只 适用 于 消息 
的 数据 部 分 ， 而 不 包括 与 每 个 消息 关联 的 长 整数 消息 类 型 。 


6.6 简单 的 程序 


既然 System V 消 息 队 列 是 随 内 核 持 续 的 ， 我 们 惑 可 以 编写 一 组 小 程序 
来 操纵 它们 ， 以 便 观察 效果 。 

6.6.1 msgcreate 程 序 

图 6-4 给 出 了 我 们 的 msgcreate 程 序 ， 它 创建 一 个 消息 队列 。 


svmsg/msgcreate.c 
1 #include "unpipc.h" 


2. Imne 
3 main(int argc, char **argv) 


int c, oflag, maid; 


oflag - SVMSG MODE | IPC CREAT; 

while ( (c = Getopt(argc, argv, "e")) !- -1) ( 
switch (c) ( 

case 'e': 

oflag |= IPC EXCL; 

break; 


if (optind !- argc - 1) 
err quit("usage: msgcreate [ -e ] <pathname>") ; 


mgid = Msgget(Ftok(argv[optind], 0), oflag); 


4 { 

5 

6 

7 

8 

9 

10 

11 

i2 } 
13 

14 

15 

16 

17 exit(0); 
18 } 


svmsg/msgcreate.c 


图 6-4 创建 一 个 System V 消 息 队 列 

9~12 我 们 允许 使 用 -e 命 令 行 选项 来 指定 IPC_EXCL 标 志 。 

16 把 必须 由 用 户 作 为 命令 行 参数 提供 的 路 径 名 作为 参数 传递 给 ftok 。 
导出 的 键 由 msgget 转 换 成 一 个 标识 符 (见习 题 6.1) 。 

6.6.2 msgsnd 程 序 

图 6-5 给 出 了 我 们 的 msgsnd 程 序 ， 它 把 一 个 指定 了 长 度 和 类 型 的 消息 放 
置 到 某 个 队列 中 。 


svmsg/msgsnd.c 
1 #include "unpipc.h" 


2 Ant 
3 main(int argc, char **argv) 


a 

5 int mqid; 

6 size_t len; 

gi long type; 

8 struct msgbuf *ptr; 
9 


if (argc != 4) 
10 err quit("usage: msgsnd <pathname> <#bytes> «type»"); 
11 len = atoi(argv[21); 
12 type - atoi(argv[3]); 
13 mqid = Msgget(Ftok(argv[1], 0), MSG W); 
14 ptr = Calloc(sizeof(long) + len, sizeof(char)); 
15 ptr-»mtype - type; 
16 Msgsnd(mqid, ptr, len, 0); 
Ey exit (0); 
18 } 


svmsg/msgsnd.c 


图 6-5 往 一 个 System V 消 息 队 列 中 加 一 个 消息 


我 们 先 分 配 一 个 指向 通用 msgbuf 结 构 的 指针 ， 然 后 根据 待 发 送 消 筷 的 
大 小 调用 calloc 分 配 真 正 的 结构 (例如 输出 缓冲 区 ) 。calloc 画 数 还 把 所 分 
配 的 缓冲 区 初始 化 为 0。 

6.6.3 msgrcv 程 序 


图 6-6 给 出 了 我 们 的 msgrcv 程 序 ， 它 从 一 个 队列 中 读 出 一 个 消息 。-n 命 


令 行 选 项 指定 非 阻塞 ，-t 命 令 行 选项 指定 msgrcv 画 数 的 type 参 数 。 


svmsg/msgrcv.c 


1 #include "unpipc.h" 


2 #define MAXMSG (8192 + sizeof (long) ) 


3 int 


4 main(int argc, char **argv) 


int c, flag, mqid; 
long type; 

ssize t n; 

struct msgbuf *buff; 


type = flag = 0; 


while ( (c = Getopt(argc, argv, "nt:")) !- -1) { 
switch (c) { 
case 'n': 
flag |= IPC NOWAIT; 
break; 
case 't': 
type = atol(optarg); 
break; 


) 
} 


if (optind != argc - 1) 
err quit("usage: msgrcv [ -n ] [ -t type ] <pathname>") ; 


mqid = Msgget(Ftok(argv[optind], 0), MSG R); 
buff = Malloc (MAXMSQ); 


n = Msgrcv(mqid, buff, MAXMSG, type, flag); 
printf("read %d bytes, type = %ld\n", n, buff-»mtype); 


exit(0); 


svmsg/msgrev.c 


图 6-6 从 一 个 System V 消 息 队列 中 读 出 一 个 消息 


2 没有 简单 的 方法 用 以 确定 一 个 消息 的 最 大 大 小 (我 们 将 在 6.10 节 讨 
论 这 个 限制 及 其 他 限制 ) ， 因 此 我 们 给 它 定 义 了 自己 的 常 值 。 
6.6.4 msgrmid 程 序 


要 删除 一 个 消息 队列 ， 我 们 以 JPC_RMID 命 令 调 用 msgctl， 如 图 6-7 所 


7? 
svmsg/msgrmid.c 
1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
图 6-7 删除 一 个 System V 消 息 队 列 
4 ( 
int mqid; 
6 if (argc != 2) 
7 err quit("usage: msgrmid <pathname>") ; 
8 mqid = Msgget(Ftok(argv[1], 0), 0); 
9 Msgctl(mqid, IPC RMID, NULL); 
10 exit (0); 
Ti^ 
svmsg/msgrmid.c 
图 6-7 (28) 
6.6.5 例子 


现在 使 用 刚刚 给 出 的 四 个 程序 。 首 移 创 建 一 个 消息 队列 并 往 其 中 写 入 
—TBE ° 

solaris % msgcreate /tmp/no/such/file 

ftok error for pathname "/tmp/no/such/file" and id 0: No such file or 
directory 

solaris 96 touch /tmp/test1 

solaris 96 msgcreate /tmp/test1 

solaris 96 msgsnd /tmp/test1 1 100 

solaris 96 msgsnd /tmp/test1 2 200 

solaris 96 msgsnd /tmp/test1 3 300 

solaris 96 ipcs -qo 

IPC status from «running system»? as of Sat Jan 10 11:25:45 1998 

T ID KEY MODE OWNER 
GROUP CBYTES QNUM 


Message Quenes: 
q 100  0x0000113e --rw-r--r-- rstevens — other1 6 


我 们 首先 使 用 一 个 不 存在 的 路 径 名 尝试 创建 一 个 消息 队列 。 这 个 示例 
表明 ftok 的 路 径 名 参数 必须 存在 。 我 们 随后 创建 文件 /mp/mest1， 并 使 用 该 
路 径 名 创建 一 个 消息 队列 。 往 该 队列 中 放置 三 个 消息 : 长 度 分 别 为 1 字 
节 、2 字 节 和 3 字 节 ， 类 型 分 别 为 100、200 和 300 (回想 图 6-1) 。ipcs 程 序 
指出 这 三 个 消息 总 共 构成 该 队列 中 的 6 个 字 节 。 

接着 展示 在 不 以 FIFO 顺 序 读 出 消息 时 msgrcv 的 type 参 数 的 使 用 。 


solaris % msgrcv -t 200 /tmp/test1 


read 2 bytes,type = 200 

solaris 96 msgrcv -t -300 /tmp/test1 

read 1 bytes,type = 100 

solaris 96 msgrcv /tmp/test1 

read 3 bytes,type = 300 

solaris 96 msgrcv -n /tmp/test1 

msgrcv error: No message of desired type 

其 中 第 一 个 例子 请 求 读 出 类 型 为 200 的 消息 ， 第 二 个 例子 请 求 读 出 类 
型 小 于 或 等 于 300 且 是 最 小 的 消息 ， 第 三 个 例子 请 求 读 出 该 队列 中 的 第 一 
个 消息 。 最 后 一 次 执行 msgrcv 程 序 用 上 了 IPC_NOWAIT 标 志 。 

如 果 我 们 给 msgrcv 指 定 一 个 正 的 type 参 数 ， 但 是 队列 中 不 存在 具有 该 
类 型 的 消息 ， 那 会 发 生 什么 ? 

solaris % ipcs -qo 

IPC status from <running system> as of Sat Jan 10 11:37:01 1998 

T ID KEY MODE OWNER 
GROUP CBYTES QNUM 


Message Quenes: 


q 100  0x0000113e --rw-r--r-- rstevens — other1 0 


0 

solaris 96 msgsnd /tmp/test1 1 100 

solaris 96 msgrcv -t 999 /tmp/test1 

^? BEA PT BEAL 
止 程序 执行 


solaris 96 msgrcv -n -t 999 /tmp/test1 

msgrcv error: No message of desired type 

solaris 96 grep desired /usr/include/sys/errno.h 

#define ENOMSG 35 /* No message of desired type */ 

solaris 96 msgrmid /tmp/test1 

我 们 首先 执行 ipcs 验 证 刚才 的 队列 是 空 的 ， 然 后 往 其 中 放置 一 个 长 度 
为 1 字 市 、 类 型 为 100 的 消息 。 当 请 求 读 出 一 个 类 型 为 999 的 消息 时 ， 
msgrcv 程 序 阻塞 (阻塞 在 msgrcv 调 用 中 ) ， 等 待 其 个 该 类 型 的 消息 被 放置 
到 该 队列 中 。 我 们 用 中 断 键 终止 该 程序 以 中 断 其 中 的 阻塞 。 接 着 在 指定 -n 
标志 以 防止 阻塞 的 前 提 下 重新 执行 msgrcv 程 序 ， 结 果 看 到 返回 ENOMSG 错 
误 。 然 后 用 我 们 的 msgrmid 程 序 从 系统 中 删除 该 队列 。 我 们 也 可 以 使 用 由 
系统 提供 的 命令 删除 该 队列 。 下 面 的 命令 指定 的 是 消息 队列 标识 符 : 

solaris 96 ipcrm -q 100 

下 面 的 命令 指定 的 是 消息 队列 键 : 

solaris 96 ipcrm -Q 0x113e 

6.6.6 msgrcvid 程 序 

要 访问 一 个 System V 消 息 队 列 ， 调 用 msgget 并 不 是 必须 的 : 我 们 只 需 
知道 该 消息 队列 的 标识 符 (使 用 ipcs 极 易 得 到 ) ， 并 拥有 该 队列 的 读 权 
限 。 图 6-8 是 图 6-6 中 msgrcv 程 序 的 简化 版 本 。 


svmsg/msgrcvid.c 


1 #include "unpipc.h" 


2 #define MAXMSG (8192 + sizeof (long)) 


3 int 

4 main(int argc, char **argv) 

51 

6 int mqid; 

" ssize t n; 

8 struct msgbuf *buff; 

9 if (argc !- 2) 

10 err quit("usage: msgrcvid «mgid»"); 
aS]: mqid = atoi(argv[1]); 

12 buff = Malloc (MAXMSG) ; 

13 n = Msgrcv(mqid, buff, MAXMSG, 0, 0); 
14 printf("read %d bytes, type = %ld\n", n, buff-»mtype); 
15 exit (0); 

16 ) 


symse/msercvid.c 


图 6-8 只 知道 标识 符 时 从 一 个 System V 消 息 队 列 中 读 


我 们 没有 调用 msgget， 而 是 由 调用 者 在 命令 行 上 指定 消息 队列 标识 
符 。 下 面 是 使 用 这 种 技巧 的 一 个 例子 。 


solaris % touch /tmp/testid 


solaris % msgcreate /tmp/testid 

solaris 96 msgsnd /tmp/testid 4 400 

solaris 96 ipcs -qo 

IPC status from «running system? as of Wed Mar 25 09:48:28 1998 


T ID KEY MODE OWNER 
GROUP CBYTES QNUM Message Queues: 
q 150  0x0000118a --rw-r--r-- rstevens — other1 4 


solaris 96 msgrcvid 150 

read 4 bytes,type = 400 

我 们 从 ipcs 的 输出 获得 标识 符 为 150， 它 就 是 我 们 的 msgrcvid 程 序 的 命 
令 行 参 数 。 

同样 的 特性 也 适用 于 System V 信 号 量 (习题 11.1) 和 System V 共 享 内 
存 区 (习题 14.1) ° 


S 


6.7 客户 一 服务 器 例子 


现在 我 们 把 4.2 市 中 的 客户 -服务 器 例子 编写 成 使 用 两 个 消息 队列 。 一 
个 队列 用 于 从 客户 到 服务 器 的 消息 ， 男 一 个 队列 用 于 从 服务 器 到 客户 的 消 
B e 
图 6-9 给 出 了 我 们 svmsg.h 头 文件 。 其 中 包括 了 我 们 的 标准 头 文件 
(unpipc.h) ， 并 定义 了 两 个 消息 队列 的 键 。 


svmsgcliserv/svmsg.h 


1 dinclude "unpipc.h" 


2 #define MQ KEY1 1234L 


3 #define MQ KEY2 2345L 
svmsgcliserv/svmsg.h 


图 6-9 使 用 消息 队列 的 客户 -服务 器 程序 的 头 文件 

图 6-10 给 出 了 服务 需 程 序 的 main 函 数 。 创 建 两 个 方 回 的 消息 队列 ， 不 

过 任何 一 个 已 经 存在 也 没有 关系 ， 因 为 我 们 没有 指定 IPC_EXCL 标 志 。 

serVer 函 数 是 图 4-30 中 所 示 的 版 本 ， 它 调用 的 mesg_send 和 mesg_recv 画 数 我 
们 稍 后 给 


svmsgcliserv/server main.c 


1 #include "svmsg.h" 
2 void server (int, int); 
3 int 


4 main(int argc, char **argv) 


6 int readid, writeid; 

7 readid = Msgget(MQ KEY1, SVMSG MODE | IPC CREAT); 
8 writeid - Msgget(MQ KEY2, SVMSG MODE | IPC CREAT); 
9 server(readid, writeid); 

10 exit (0); 

11 ) 


svmsgcliserv/server main.c 


到 6-10 使 用 消息 队列 的 服务 器 程序 main 函 数 

图 6-11 给 出 了 客户 程序 的 main 函 数 。 我 们 打开 两 个 方 同 的 消息 队列 ， 
随后 调用 图 4-29 中 的 client 男 数 。 该 久 数 调用 我 们 接 下 去 给 出 的 mesg_send 
Allmesg_recvEK 2 ° 


client 和 server 函 数 都 使 用 图 4-25 中 所 示 的 消息 格式 。 这 两 个 范 数 还 调 
re] nese end Wine ee etd 图 4-27 和 图 4-28 给 出 的 这 两 个 函数 
的 版 本 调用 了 write 和 read， 这 对 于 管道 和 FIFO 是 有 用 的 ， ， 
则 需要 重新 编写 它们 。 图 6-12 和 图 6-13 给 出 了 它们 的 新 版 本 。 注 意 ， 这 两 
个 函数 的 前 后 两 个 版 本 需 传 递 的 参数 不 变 ， E us 
有 一 个 整数 描述 符 (用 于 访问 管道 或 FIFO) ， 也 可 以 含有 一 个 整数 消息 队 
列 标识 符 。 


svmsgcliserv/client_main.c 


1 #include "svmsg.h" 
2 void client(int, int); 
int 


main(int argc, char **argv) 


{ 


int readid, writeid; 


7 /* assumes server has created the queues */ 
8 writeid - Msgget(MQ KEY1, 0); 
9 readid = Msgget (MQ_KEY2, 0); 


10 client (readid, writeid) ; 


11 /* now we can delete the queues */ 
12 Msgctl(readid, IPC RMID, NULL); 
13 Msgctl(writeid, IPC RMID, NULL); 


14 exit(0); 


svmsgcliserv/client main.c 


图 6-11 fi FH TELA AY 7c P E main ER 


svmsgcliserv/mesg send.c 
1 #include "mesg.h" 


2 ssize t 
3 mesg send(int id, struct mymesg *mptr) 


4 { 
5 
6 } 


return(msgsnd(id, &(mptr-»mesg type), mptr-»mesg len, 0)); 


svmsgcliserv/mesg send.c 


图 6-12 用 于 消息 队列 的 mesg_send 函 数 


svmsgcliserv/mesg recv.c 


1 include "mesg.h" 

2 ssize t 

3 mesg recv(int id, struct mymesg *mptr) 

4 { 

5 ssize t n; 

6 n = msgrcv(id, &(mptr-»mesg type), MAXMESGDATA, mptr->mesg type, 0); 
5 mptr-»mesg len - n; /* return #bytes of data */ 

8 return (n); /* -1 on error, 0 at EOF, else >0 */ 

9 } 


svmsgcliserv/mesg recv.c 


6-13 用 于 消息 队列 的 mesg_recv 范 数 
6.8 复 用 消息 


与 一 个 队列 中 的 每 个 消息 相关 联 的 类 型 字段 提供 了 两 个 特性 。 
(1) 类 型 字段 可 用 于 标识 消息 ， 从 而 允许 多 个 进程 在 单个 队列 上 复 用 
(multiplex) 消息 。 举 例 来 说 ， 类 型 字段 的 某 个 值 用 于 标识 从 各 个 客户 到 
服务 器 的 消息 ， 对 于 每 个 客户 均 为 唯一 的 另外 某 个 值 用 于 标识 从 服务 器 到 
各 个 客户 的 消息 。 每 个 客户 的 进程 ID 自然 可 用 作对 于 每 个 客户 均 为 唯一 的 
类 型 字段 。 
(2) 类 型 字段 可 用 作 优 先 级 字段 。 这 人 允许 接收 者 以 不 同 于 先进 先 出 
(FIFO) 的 某 个 顺序 读 出 各 个 消息 。 使 用 管道 或 FIFO 时 ， 数 据 必须 以 写 入 
的 顺序 读 出 。 使 用 System V 消 息 队 列 时 ， 消 息 能 够 以 任意 顺序 读 出 ， 只 
跟 与 消息 类 型 关联 的 值 一 致 融 行 。 而 且 我 们 可 以 指定 IPC_NOWAIT 标 志 调 
用 msgrcv 从 某 个 队列 中 读 出 某 个 给 定 类 型 的 任意 消息 ， 但 是 如 果 没 有 给 定 
类 型 的 消息 存在 ， 那 就 立即 返回 。 
6.8.1 例子 : 每 个 应 用 一 个 队列 
回想 我 们 那个 由 一 个 服务 器 进程 和 单个 客户 进程 构成 的 简单 应 用 例 
子 。 使 用 管道 和 FIFO 时 ， 为 在 两 个 方向 上 交换 数据 需 两 个 IPC 通 道 ， 因 为 
这 两 种 类 型 的 IPC 是 单 向 的 。 使 用 消息 队列 时 ， 单 个 队列 就 够 用 ， 由 每 个 
消息 的 类 型 来 标识 该 消息 是 从 客户 到 服务 器 ， 还 是 从 服务 器 到 客户 。 
考虑 更 为 复杂 的 情况 : 一 个 服务 器 带 多 个 客户 。 这 儿 我 们 可 以 使 用 壁 
如 说 值 为 1 的 类 型 来 指示 从 任意 客户 到 服务 器 的 消息 。 如 果 该 客户 将 自己 


的 进程 ID 作为 消 妃 的 一 部 分 传递 ， 服 务 套 束 能 把 目 己 的 消 轧 发 送 给 该 客 
户 ， 办 法 是 把 该 客户 的 进程 ID 用 作 消息 类 型 。 每 个 客户 然后 把 目 己 的 进程 
ID 指定 为 msgrcv 的 type 参 数 。 图 6-14 展 示 了 单个 消 轧 队列 是 如 何 用 于 在 多 
个 客户 和 单个 服务 右 之 间 复 用 消息 的 。 


类 型 =1234 或 9876: 服务 器 应 答 


PID 1234 PID 9876 


到 6-14 在 多 个 客户 和 单个 服务 器 之 间 复 用 消息 

当 单 个 IPC 通 道 同 时 由 多 个 客户 和 单个 服务 需 使 用 时 ， 总 是 存在 死 锁 
的 隐患 。 客 户 们 可 以 填 满 消息 队列 (在 本 例子 中 ) ， 妨 碍 服务 器 发 送 应 
答 。 于 是 这 些 客户 阻塞 在 msgsnd 中 ， 服 务 右 也 这 样 。 可 检测 这 种 死 锁 的 办 
法 之 一 是 ， 约 定 服务 器 对 消息 队列 总 是 使 用 非 阻塞 写 。 

现在 改 用 单个 消 轧 队列 重新 编写 我 们 的 客户 -服务 器 例子 程序 ， 给 每 个 
方 同 的 消 居 使 用 不 同 的 消息 类 型 。 这 些 程 序 使 用 这 样 的 约定 ， 类 型 为 1 的 
消 恩 是 从 客户 到 服务 器 的 ， 所 有 其 他 消息 有 一 个 等 于 其 客户 进程 ID 的 类 
型 。 该 客户 -服务 器 应 用 要 求 每 个 客户 请 求 舍 有 对 应 客户 的 进程 ID 以 及 所 请 
求 的 路 径 名 ， 这 与 我 们 在 4.8 市 的 做 法 类 似 。 


图 6-15 给 出 了 服务 器 程序 的 main 了 范 数 。 其 中 svmsg.h 尖 文 件 在 图 6-9 中 
给 出 。 服 务 器 只 创建 一 个 消息 队列 ， 如 果 它 已 对 存在 ， 那 也 没有 关系 。 给 
server 辑 数 的 两 个 参数 所 用 的 是 同一 个 消息 队列 标识 符 。 


svmsgmpx1q/server_main.c 


1 #include "svmsg.h" 
2 void server (int, int); 
3 int 


4 main(int argc, char **argv) 


6 int msqid; 

7 msqid = Msgget (MQ_KEY1, SVMSG MODE | IPC CREAT); 

8 server (msqid, msqid); /* same queue for both directions */ 
9 exit (0); 


svmsgmpx1q/server_main.c 


图 6-15 服务 器 程序 main 函 数 

server 函 数 完 成 所 有 的 服务 器 处 理 ， 在 网 6-16 中 给 出 。 该 函数 是 图 4-23 
和 图 4-30 的 组 合 ， 其 中 图 4-23 是 读 出 由 一 个 进程 ID 和 一 个 路 径 名 构成 的 命 
令 的 FIFO 服 务 器 程序 ， 图 4-30 则 使 用 了 我 们 的 mesg_send 和 mesg_recv 范 
数 。 注 意 ， PUDOR IDEE Um 合 该 客户 的 所 有 消 
乱 的 消息 类 型 。 这 个 server 函 数 还 是 一 个 调用 一 次 后 永 不 返回 的 无 限 循 
环 ， 每 次 循环 读 出 一 个 客户 请 求 并 发 回应 答 。 这 是 个 迭代 服务 器 ， 如 4.9 市 
中 讨论 的 那样 。 


svmsgmpx I q/server.c 


1 #include "mesg.h" 
2 void 
3 server(int readfd, int writefd) 
4 { 
5 FILE *fp; 
6 char *ptr; 
"7 pid t pid; 
8 ssize t n; 
9 struct mymesg mesg; 
10 for (7%) { 
11 /* read pathname from IPC channel */ 
12 mesg.mesg type = 1; 
13 if ( (n = Mesg recv(readfd, &mesg)) == 0) { 
14 err msg("pathname missing"); 
15 continue; 
16 ) 
17 mesg.mesg data[n] = '\0'; /* null terminate pathname */ 
18 if ( (ptr = strchr(mesg.mesg data, ' ')) -- NULL) { 
19 err msg("bogus request: %s", mesg.mesg data); 
20 continue; 
21 } 
22 *ptr++ = 0; /* null terminate PID, ptr = pathname */ 
23 pid = atol(mesg.mesg_data) ; 
24 mesg.mesg type = pid; /* for messages back to client */ 
25 if ( (fp - fopen(ptr, "r")) -- NULL) ( 
26 /* error: must tell client */ 
27 snprintf (mesg.mesg data + n, sizeof(mesg.mesg data) - n, 
28 ": can't open, %s\n", strerror(errno)); 
29 mesg.mesg len - strlen(ptr); 
图 6-16 server ER Zi 
30 memmove (mesg.mesg data, ptr, mesg.mesg len); 
31 Mesg send(writefd, &mesg); 
32 ) eise { 
33 /* fopen succeeded: copy file to IPC channel */ 
34 while (Fgets(mesg.mesg data, MAXMESGDATA, fp) !- NULL) { 
35 mesg.mesg len - strlen(mesg.mesg data); 
36 Mesg send(writefd, &mesg); 
37 } 
38 Fclose (fp) ; 
39 } 
40 /* send a 0-length message to signify the end */ 
41 mesg.mesg len = 0; 
42 Mesg_send(writefd, &mesg) ; 
43 } 
44 } 


svmsgmpx14q/server.c 


图 6-17 给 出 了 客户 程序 的 main 函 数 。 客 户 打开 唯一 的 消 轧 队列 ， 它 必 


须 已 由 服务 器 创建 。 


1 #include "svmsg.h" 

2 void client (int, int); 
3 int 

4 main(int argc, char **argv) 
5 

6 


{ 


svmsgmpx1q/client_main.c 


int msqid; 
7 /* server must create the queue */ 
8 msqid = Msgget (MQ KEY1, 0); 
9 client (msqid, msqid) ; /* same queue for both directions */ 
10 exit (0); 
1j 
svmsgmpx1q/client_main.c 
图 6-17 客户 程序 main 函 数 


图 6-18 所 示 的 client 函 数 为 我 们 的 客户 完成 所 有 处 理 。 该 函数 是 网 4-24 
和 图 4-29 的 组 合 ， 其 中 图 4-24 发 送 一 个 进程 ID 后 跟 一 个 路 径 名 ， 图 4-29 合 
用 了 我 们 的 mesg_send 和 mesg_recv 函 数 。 注 意 从 mesg _recv 请 求 的 消息 类 型 


等 于 当前 客户 的 进程 ID 。 


1 #include "mesg.h" 

2 void 

3 client(int readfd, int writefd) 

4 ( 

5 size t len; 

6 ssize t n; 

y/ char *ptr; 

8 struct mymesg mesg; 

9 /* start buffer with pid and a blank */ 
10 snprintf (mesg.mesg data, MAXMESGDATA, "%ld ", (long) getpid()); 
1T len = strlen(mesg.mesg data); 


svmsgmpx 1 q/client.c 


图 6-18 client KZ 


12 ptr = mesg.mesg data + len; 


13 /* read pathname */ 

14 Fgets (ptr, MAXMESGDATA - len, stdin); 

15 len = strlen(mesg.mesg data); 

16 if (mesg.mesg data[len-1] == '\n') 

T7 len--; /* delete newline from fgets() */ 
18 mesg.mesg len - len; 

19 mesg.mesg type - 1; 

20 /* write PID and pathname to IPC channel */ 
Zr Mesg send(writefd, &mesg); 

22 /* read from IPC, write to standard output */ 
23 mesg.mesg type - getpid(); 

24 while ( (n = Mesg recv(readfd, &mesg)) > 0) 

25 Write(STDOUT FILENO, mesg.mesg data, n); 

26 ) 


svmsgmpx  q/client.c 


图 6-18 (2x) 
FA TKY client 4l server Ex ži #8 (E FA Ed 6-12 40 Al 6-13 F AY) mesg_send Ail 
mesg_recvEH RY ° 
6.8.2 例子 : 每 个 客户 一 个 队列 
现在 把 前 面 的 例子 改 成 给 去 往 服 务 器 的 所 有 客户 请 求 使 用 一 个 队列 ， 
给 每 个 客户 使 用 一 个 队列 接收 去 往 各 个 客户 的 服务 器 应 答 。 图 6-19 展 示 了 
这 样 的 设计 。 


子 进 程 父 进 程 子 进程 


文件 内 容 文件 内 容 


图 6-19 每 个 服务 器 一 个 队列 ， 每 个 客户 一 个 队列 
服务 器 的 队列 有 一 个 对 客户 来 说 众所周知 的 键 ， 但 是 各 个 客户 以 
IPC_PRIVATE 键 创建 各 自 的 队列 。 这 里 并 未 随 请 求 传递 本 进程 ID， 而 是 由 
每 个 客户 把 自己 的 私 用 队列 的 标识 符 传递 给 服务 器 ， 服 务 器 把 自己 的 应 答 
发 送 到 由 客户 指出 的 队列 中 。 我 们 还 以 并 发 服务 器 模型 编写 这 个 服务 器 程 


序 ， 给 每 个 客户 fork 一 次 。 

这 种 设计 的 潜在 问题 之 一 发 生 在 某 个 客户 中 途 死 亡 时 ， 这 种 情况 下 它 
的 私 用 队列 中 可 能 永远 残留 消息 〈 或 者 至 少 到 内 核 重 新 自 举 或 某 个 用 户 显 
式 地 删除 该 队列 为 止 ) 。. 

下 列 头 文件 和 画 数 跟 以 前 的 版 本 一 样 : 

mesg.h 头 文件 (图 4-25) ; 

svmsg.h 头 文件 (图 6-9) ; 

服务 器 程序 main 函 数 (图 6-15) ; 

mesg_send 函 数 (图 4-27) 。 

图 6-20 给 出 了 我 们 的 客户 程序 main 函 数 ， 它 与 图 6-17 的 差别 很 小 。 它 
打开 服务 器 的 众所周知 队列 (MQ_KEY1) ， 然 后 用 IPC_PRIVATE 键 创建 


自己 的 队列 。 这 两 个 队列 标识 符 成 为 client 函 数 (图 6-21) 
运行 完 时 ， 它 的 私 用 队列 被 删除 。 


1 #include "svmsg.h" 
2 void client(int, int); 


3 int 

4 main(int argc, char **argv) 
5 

6 


{ 


int readid, writeid; 
7 /* server must create its well-known queue */ 
8 writeid = Msgget (MQ_KEY1, 0); 
9 /* we create our own private queue */ 
10 readid = Msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT); 
TI client (readid, writeid); 
12 /* and delete our private queue */ 
13 Msgctl(readid, IPC RMID, NULL); 
14 exit(0); 
15 ) 


图 6-20 % ^ fi FF main tK Zt 


的 参数 。 当 客户 


svmsgmpxnq/client_main.c 


svmsgmpxnq/client_main.c 


1 #include "mesg.h" 

2 void 

3 client (int readid, int writeid) 

af 

5 size_t len; 

6 ssize t n; 

7 char *ptr; 

8 struct mymesg mesg; 

9 /* start buffer with msgid and a blank */ 

10 snprintf (mesg.mesg data, MAXMESGDATA, "$d ", readid) ; 
11 len = strlen(mesg.mesg data); 

12 ptr = mesg.mesg data + len; 

13 /* read pathname */ 

14 Fgets(ptr, MAXMESGDATA - len, stdin); 

15 len - strlen(mesg.mesg data); 

16 if (mesg.mesg data[len-1] == '\n') 

17 len--; /* delete newline from fgets() */ 
18 mesg.mesg len - len; 

19 mesg.mesg type - 1; 


svmsgmpxnq/client.c 


图 6-21 clientEk Zi 


20 /* write msqid and pathname to server's well-known queue */ 


21 Mesg send(writeid, &mesg); 

22 /* read from our queue, write to standard output */ 
23 while ( (n = Mesg recv(readid, &mesg)) > 0) 

24 Write(STDOUT FILENO, mesg.mesg data, n); 


svmsgmpxndq/client.c 


图 6-21 (A) 


图 6-21 是 client 函 数 。 该 函数 与 图 6-18 几 乎 相同 ， 但 是 作为 请 求 的 一 部 
分 传递 的 是 本 客户 的 私 用 队列 标识 符 ， 而 不 是 本 客户 的 进程 ID。mesg 结 构 
中 的 消息 类 型 仍 保留 为 1， 因 为 它 是 两 个 方向 的 消息 都 使 用 的 类 型 。 

图 6-23 是 server 范 数 。 与 图 6-16 相 比 的 主要 变化 是 将 这 个 函数 编写 为 一 
个 无 限 循环 ， 每 次 循环 给 一 个 客户 请 求 调用 fork © 

给 SIGCHLD 建 立信 号 处 理 程序 

10 既然 是 s s 进程 ， 我 们 必须 顾虑 僵尸 进程 。 
UNPv1 的 5.9 节 和 5.10 方 详细 讨论 了 这 一 点 。 这 里 我 们 给 SIGCHLD 信 号 建立 
一 个 信号 处 理 程序 ， ee Bn 我 们 的 sig_chld (图 6-22) 
BLOCS HI o 

12~18 服务 器 父 进程 阻塞 在 mesg_recv 调 用 中 ， 等 待 下 一 个 客户 消息 
的 到 达 。 

25~45 调用 fork 派 生 一 个 子 进程 ， 由 子 进程 尝试 打开 所 请 求 的 文件 ， 
发 回 一 个 出 错 消 乱 或 该 文件 的 内 容 。 我 们 特意 把 fopen 调 用 放 在 子 进程 而 不 
是 父 进程 中 ， 以 防 该 文件 在 某 个 远程 文件 系统 上 ， 因 为 要 是 这 样 ， 如 果 发 
生 任 何 网 络 问 题 ， 文 件 的 打开 就 可 能 花 一 段 时 间 。 

图 6-22 给 出 了 SIGCHLD 信 号 的 处 理 程序 。 它 复制 自 UNPv1 的 图 5-11 ° 


svmsgmpxnq/sigchldwaitpid.c 
1 #include "unpipc.h" 


2 void 
3 sig chld(int signo) 
4 { 


5 pidt pid; 

6 int stat; 

7 while ( (pid = waitpid(-1, &stat, WNOHANG)) > 0) ; 
8 return; 

9 } 


svmsgmpxnq/sigchldwaitpid.c 


图 6-22 调用 waitpid 的 SIGCHLD 信 号 处 理 程序 

每 次 调用 我 们 的 信号 处 理 程序 时 ， 它 就 在 一 个 循环 中 调用 waitpid， 以 
取得 已 终止 的 任何 子 进程 的 终止 状态 。 该 信号 处 理 程序 随后 返回 。 这 可 能 
造成 一 个 问题 ， 因 为 父 进程 会 把 大 部 分 时 间 花 在 阻塞 在 mesg_recv 函 数 (图 
6-13) 的 msgrcv 调 用 中 。 当 我 们 的 信号 处 理 程序 返回 时 ， 这 个 msgrcv 调 用 
就 被 中 断 。 也 就 是 说 该 玉 数 将 返回 一 个 EINTR 错 误 ， 如 UNPv1 的 5.9 市 所 
述 o 

我 们 必须 处 理 这 个 被 中 断 的 系统 调用 ， 图 6-24 给 出 Mesg_recv 包 于 函数 
的 新 版 本 。 它 允许 有 来 和 目 mesg_recv 的 EINTR 错 误 (mesg_recv 只 是 调用 
msgrcv) ， 如 果 发 生 该 错误 ， 那 就 再 次 调用 mesg_recv 。 


svmsgmpxnq/server.c 


1 #include "mesg.h" 

2 void 

3 server(int readid, int writeid) 

E 

5 FILE *fp; 

6 char *ptr; 

7 ssize t n; 

8 struct mymesg mesg; 

9 void sig chld(int); 

10 Signal(SIGCHLD, sig chld); 

Jt. for (7 FF) 

12 /* read pathname from our well-known queue */ 

13 mesg.mesg type - 1; 

14 if ( (n = Mesg recv(readid, &mesg)) == 0) { 

15 err msg("pathname missing"); 

16 continue; 

17 ) 

18 mesg.mesg data[n] = '\0'; /* null terminate pathname */ 
19 if ( (ptr = strchr(mesg.mesg data, ' ')) -- NULL) { 

20 err msg("bogus request: $s", mesg.mesg data); 

21 continue; 

22 ) 

23 *ptr++ = 0; /* null terminate msgid, ptr = pathname */ 
24 writeid = atoi(mesg.mesg data) ; 

25 if (Fork() == 0) { /* child */ 

26 if ( (fp = fopen(ptr, "r")) == NULL) { 

27 /* error: must tell client */ 

28 snprintf(mesg.mesg data + n, sizeof (mesg.mesg data) - n, 
29 ": can't open, %s\n", strerror (errno) ) ; 

30 mesg.mesg len = strlen(ptr) ; 

31 memmove (mesg.mesg data, ptr, mesg.mesg len); 

32 Mesg_send(writeid, &mesg) ; 

33 } else { 

34 /* fopen succeeded: copy file to client's queue */ 
35 while (Fgets(mesg.mesg_data, MAXMESGDATA, fp) != NULL) { 
36 mesg.mesg_len = strlen(mesg.mesg_ data) ; 

37 Mesg send(writeid, &mesg); 

38 ) 

39 Fclose(fp); 

40 ) 

41 /* send a 0-length message to signify the end */ 

42 mesg.mesg len - 0; 

43 Mesg send(writeid, &mesg); 

44 exit(0); /* child terminates */ 

45 ) 

46 /* parent just loops around */ 

47 } 

48 } 


svmsgmpxnq/server.c 


图 6-23 server ENA 


AY vmsgmpxnq/mesg recv. [4 


10 ssize t 
11 Mesg recv(int id, struct mymesg *mptr) 
12:1 


13 ssize t n; 

14 do ( 

15 n - mesg recv(id, mptr); 

16 } while (n == -1 && errno == EINTR); 
T7 it (n. 1) 

18 err sys("mesg recv error"); 

19 return (n); 


20 ) 


svmsgmpxnq/mesg recv.c 


到 6-24 处 理 被 中 断 系统 调用 的 Mesg_recv 包 于 函数 


6.9 消息 队列 上 使 用 select 和 poll 


System V 消 息 队 列 的 问题 之 一 是 它们 由 各 上 自 的 标识 符 而 不 是 描述 符 标 
识 。 这 意味 着 我 们 不 能 在 消息 队列 上 直接 使 用 select 或 poll \UNPv1 第 6 


S 


a 


实际 上 有 一 个 版 本 的 Unix ( 即 IBM 的 AIX) 把 select 扩 展 成 能 够 在 描述 
符 之 外 处 理 System V 消 息 队 列 。 不 过 这 是 不 可 移植 的 ， 只 适用 于 AIX 。 

当 有 人 想 编写 一 个 同时 处 理 网 络 连 接 和 了 PC 连接 的 服务 器 程序 时 ， 这 
种 缺失 的 特性 往往 暴露 出 来 。 使 用 套 接 字 API 或 XTI API (UNPv1) 的 网 络 
通信 使 用 的 是 描述 符 ， 因 而 允许 使 用 select 或 poll。 管 道 和 FIFO 也 适合 这 两 
个 函数 ， 因 为 它们 也 是 由 描述 符 标识 的 。 

解决 该 问题 的 办 法 之 一 是 : 让 服务 器 创建 一 个 管道 ， 然 后 派生 一 个 子 
进程 ， 由 子 进程 阻塞 在 msgrcv 调 用 中 。 当 有 一 个 消息 准备 好 被 处 理 时 ， 
msgrcv 返 回 ， 子 进程 接着 从 所 指定 的 队列 中 读 出 该 消息 ， 并 把 该 消 轧 写 入 
管道 。 服 务 器 父 进程 当时 可 能 在 该 管道 以 及 一 些 网 络 连 接 上 select。 这 种 办 
法 的 负面 效果 是 消息 被 处 理 了 三 次 : 一 次 是 在 子 进程 使 用 msgrcv 读 出 时 ， 
一 次 是 在 子 进程 写 入 管道 时 ， 最 后 一 次 是 在 父 进程 从 该 管道 中 读 出 时 。 为 
避免 这 样 的 额外 处 理 ， 父 进程 可 以 创建 一 个 在 它 自身 和 子 进程 之 间 分 享 的 
共享 内 存 区 ， 然 后 把 管道 用 作 父 子 进程 间 的 一 种 标志 (习题 12.5) 。 


在 图 5-14 中 我 们 给 出 了 一 种 不 需要 fork 束 在 Posix 消 轧 队 列 上 间接 使 用 
select 或 poll 的 办 法 。 在 Posix 消 息 队 列 上 可 以 只 使 用 单个 进程 的 原因 是 它们 
提供 了 通知 能 力 ， 当 某 个 空 队列 上 有 一 个 消息 到 达 时 ， 这 种 通知 能 力 将 产 
生 一 个 信号 。System V 消 息 队 列 不 提供 这 种 能 力 ， 因 此 必须 fork 一 个 子 进 
程 ， 由 该 子 进程 阻塞 在 msgrcv 调 用 中 。 

与 网 络 编程 相 比 ，System V 消 息 队 列 另 一 个 缺失 的 特性 是 无 法 打探 一 
个 消息 ， 而 这 是 recv、recvform 和 recvmsg 函 数 的 MSG_PEEK 标 志 提 供 的 能 
Jj (UNPv1 第 356 页 [10] ) 。 要 是 提供 了 这 种 能 力 ， 刚 刚 描述 的 (用 于 绕 
过 select 问 题 的 ) 父子 进程 情形 就 可 以 做 得 更 为 有 效 ， 办 法 是 让 子 进程 指定 
msgrcv 的 颖 探 标 志 ， 当 有 一 个 消息 准备 好 时 就 写 1 个 字 节 到 管道 中 ， 以 通 
知 父 进 程 读 出 该 消息 。 


6.10 消息 队列 限制 


正如 3.8 市 中 所 指出 的 那样 ,消息 队列 上 往往 存在 某 些 系统 限制 。 图 6- 
给 出 了 两 种 实现 上 的 这 些 值 。 第 一 栏 是 内 容 为 所 说 明 限 制 值 的 内 核 变 量 
fiSystemV 4A F ° 


每 个 消息 的 最 大 字 节 数 8 192 2 048 


任何 一 个 消息 队列 上 的 最 大 字 节 数 
系统 范围 的 最 大 消息 队列 数 
系统 范围 的 最 大 消息 数 


到 6-25 System V 消 息 队 列 的 典型 系统 限制 
许多 源 目 SVR4 的 实现 还 有 从 它们 的 初始 实现 继承 来 的 额外 限制 : 
msgssz 和 msgseg。msgssz 往 往 是 8， 这 是 存放 消息 数据 的 “ 节 (segment) " 
的 大 小 (FARFETT) 。 一 个 21 字 下 数据 的 消息 将 存放 在 3 个 这 样 的 和 
中 ， 其 中 最 后 一 和 的 后 3 个 字 和 未 用 上 。msgseg 是 分 配 了 的 节 数 ， 往 往 是 1 
024。 因 历史 原因 ， 它 一 直 存 放 在 某 个 短 整 数 中 ， 因 而 必须 小 于 32 768。 所 


有 消息 数据 的 总 共 可 用 字 和 数 是 这 两 个 变量 的 乘积 ， 通 常 是 8x1 024=8 192 
FH o 

本 节 的 目的 是 输出 一 些 典 型 值 ， 以 辅助 在 代码 移植 上 所 作 的 计划 。 当 
一 个 系统 运行 大 量 使 用 消息 队列 的 应 用 时 ， 这 些 参数 (或 类 似 参 数 ) 的 内 
核 微 调 通常 是 必需 的 〈 关 于 内 核 参 数 微调 已 在 3.8 节 中 讲述 过 ) 。 


图 6-26 给 出 了 确定 图 6-25 中 所 示 四 个 限制 值 的 程序 。 


svmsg/limits.c 


1 #include "unpipc.h" 


2 #define MAX DATA 64*1024 
3 #define MAX NMESG 4096 

4 #define MAX NIDS 4096 
5 


int max mesg; 
6 struct mymesg { 
7 long type; 
8 char data [MAX DATA]; 
9 } mesg; 
10 int 
11 main(int argc, char **argv) 
12 
13 int i, j, msqid, qid[MAX NIDS]; 
14 /* first try and determine maximum amount of data we can send */ 
15 msqid - Msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT); 
16 mesg.type - 1; 
17 for (i = MAX DATA; i > 0; i -= 128) { 
18 if (msgsnd(msqid, &mesg, i, 0) == 0) { 
19 printf ("maximum amount of data per message = %d\n", i); 
20 max_mesg = i; 
21 break; 


图 6-26 确定 System V 消 息 队 列 上 的 系统 限制 


22 } 


23 if (errno != EINVAL) 
24 err sys("msgsnd error for length %d", i); 
25 ) 
26 if: (2 == (0) 
27 err quit ("i == 0"); 
28 Msgctl(msqid, IPC RMID, NULL); 
29 /* see how many messages of varying size can be put onto a queue */ 
30 mesg.type - 1; 
31 for (i = 8; i <= max mesg; i *= 2) { 
32 msqid - Msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT); 
33 for (j = 0; j < MAX NMESG; j++) ( 
34 if (msgsnd(msqid, &mesg, i, IPC NOWAIT) != 0) { 
35 if (errno -- EAGAIN) 
36 break; 
37 err sys("msgsnd error, i = $d, j = %d", i, j); 
38 break; 
39 ) 
40 } 
41 printf ("%d %d-byte messages were placed onto queue,", j, i); 
42 printf (" %d bytes total\n", i*j); 
43 Msgctl(msqid, IPC RMID, NULL); 
44 } 
45 /* see how many identifiers we can "open" */ 
46 mesg.type = 1; 
47 for (i = 0; i <= MAX_NIDS; i++) { 
48 if ( (qid[i] = msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT)) == -1) { 
49 printf ("%d identifiers open at once\n", i); 
50 break; 
51 } 
52 } 
53 for (J = 0; J < i; j++) 
54 Msgct1(qid[j], IPC RMID, NULL); 
55 exit (0); 
56 } 
svmsg/limits.c 
图 6-26 (5) 


确定 最 大 消息 大 小 

147-28 为 确定 最 大 消息 大 小 ， 我 们 尝试 发 送 一 个 含有 65536 字 市 数据 
的 消息 ， 如 果 失 败 了 就 尝试 含有 65408 字 节 数 据 的 消息 ， 如 此 等 等 ， 直 到 
msgsnd 调 用 成 功 为 止 。 

确定 一 个 队列 中 可 放置 多 少 不 同 大 小 消息 

29~44 从 8 字 节 消息 开始 查看 一 个 给 定 队 列 上 能 放置 多 少 消息 。 一 旦 
确定 该 限制 值 ， 我 们 就 删除 其 队列 (丢弃 其 中 的 所 有 消息 ， 并 以 16 字 市 
消息 再 次 尝试 。 这 样 一 直 党 试 到 超过 第 一 个 步骤 中 确定 的 最 大 消息 大 小 为 


止 。 我 们 预期 较 小 的 消息 将 在 过 到 每 队列 总 消息 数 的 限制 ， 较 大 的 消息 将 
遇 到 每 队列 总 字 节 数 的 限制 。 

确定 同时 可 打开 多 少 标识 符 

457-54 任何 时 刻 能 打开 着 的 消息 队列 标识 符 最 大 数目 通常 存在 一 个 系 
统 限制 。 我 们 通过 一 直 创 建 队列 直到 msgget 失 败 来 确定 该 限制 。 

我 们 先 在 Solaris 2.6 下 运行 该 程序 ， 接 着 在 Digital Unix 4.0B 下 运行 ， 
结果 符合 图 6-25 中 所 示 的 值 。 


solaris % limits 


maximum amount of data per message = 2048 

40 8-byte messages were placed onto queue,320 bytes total 

40 16-byte messages were placed onto queue,640 bytes total 

40 32-byte messages were placed onto queue, 1280 bytes total 
40 64-byte messages were placed onto queue,2560 bytes total 
32 128-byte messages were placed onto queue,4096 bytes total 
16 256-byte messages were placed onto queue,4096 bytes total 
8 512-byte messages were placed onto queue,4096 bytes total 

4 1024-byte messages were placed onto queue,4096 bytes total 
2 2048-byte messages were placed onto queue,4096 bytes total 
50 identifiers open at once 

alpha 96 limits 

maximum amount of data per message = 8192 

40 8-byte messages were placed onto queue,320 bytes total 

40 16-byte messages were placed onto queue,640 bytes total 

40 32-byte messages were placed onto queue, 1280 bytes total 
40 64-byte messages were placed onto queue,2560 bytes total 
40 128-byte messages were placed onto queue,5120 bytes total 
40 256-byte messages were placed onto queue,10240 bytes total 
32 512-byte messages were placed onto queue,16384 bytes total 


16 1024-byte messages were placed onto queue,16384 bytes total 

8 2048-byte messages were placed onto queue,16384 bytes total 

4 4096-byte messages were placed onto queue,16384 bytes total 

2 8192-byte messages were placed onto queue,16384 bytes total 

63 identifiers open at once 

Digital Unix 下 输出 63 个 标识 符 的 限制 ， 而 不 是 图 6-25 所 示 的 64 个 ， 其 
原因 在 于 已 有 一 个 系统 守护 进程 在 使 用 一 个 标识 符 。 


6.11 小 结 


System V 消 息 队 列 与 Posix 消 息 队 列 类 似 。 新 的 应 用 程序 应 考虑 使 用 
Posix 消 息 队 列 ， 不 过 大 量 的 现 有 代码 使 用 System V 消 息 队 列 。 然 而 把 一 个 
应 用 程序 从 使 用 System V 消 筷 队 列 重新 编写 成 使 用 Posix 消 息 队 列 不 是 件 难 
事 。Posix 消 息 队 列 缺 失 的 主要 特性 是 从 队列 中 读 出 指定 优先 级 的 消息 的 能 
力 。 这 两 种 消息 队列 都 不 使 用 真正 的 描述 符 ， 从 而 造成 在 消息 队列 上 使 用 
select 或 poll 的 困难 。 


习题 


6.1 修改 图 6-4 中 的 程序 以 接受 IPC_PRIVATE 这 样 的 路 径 名 参数 ， 若 指 
定 了 这 样 的 参数 ， 就 以 一 个 私 用 键 创建 一 个 消息 队列 。 这 么 一 来 ，6.6 节 中 
的 其 余 程 序 必 须 如 何 变 动 ? 

6.2 在 图 6-14 中 ， 我 们 为 什么 为 发 送 给 服务 器 的 消息 使 用 1 这 个 类 型 ? 

6.3 在 图 6-14 中 ， 要 是 一 个 恶意 的 客户 同 服务 句 发 送 了 许多 消息 ， 但 它 
从 来 不 去 读 服 务 器 的 应 答 ， 那 么 会 发 生 什 么 ? 图 6-19 对 于 这 种 类 型 的 客户 
"TF SES? 

6.4 重新 编写 5.8 广 中 Posix 消 轧 队 列 的 实现 ， 改 用 System VIB AA If 
蔡 内 存 映射 /O 。 


[1]. 此 处 为 UNPv1 第 2 版 英文 原版 书页 码 ， 第 3 版 英文 原版 书 为 第 774~ 僵 775 
页 。 一 一 编者 注 


[2]. 此 处 为 APUE 第 1 版 英文 原版 书 节 号， 第 2 版 为 15.3 广 。 一 一 编者 注 
[3]. 由 原因 推出 结果 。 一 一 编者 注 


[4 一 个 消 筷 队列 的 名 字 在 系统 中 的 存在 本 身 也 占用 其 引用 计数 占 的 一 个 
3| " mdq_unlink 从 系统 中 删除 该 名 字 意 味 着 同时 将 其 引用 计数 减 1， 知 
变 为 0 则 真正 拆除 该 队列 。 一 -一 译 者 注 


[5]. 跟 mq_unlink 一 样 ，mq_close 也 将 当前 消息 队列 的 引用 计数 减 1， 若 变 为 
0 则 附 遍 拆除 该 队列 。 一 一 译 者 注 


[6]. 此 处 为 APUE 第 1 版 英文 原版 书 节 号 ， 第 2 版 的 17.4.1 广 讲述 通过 管道 传 
递 文件 描述 符 。 一 一 编者 注 


[7]. 在 由 Posix.1 定 义 的 所 有 结构 中 (aiocb ` group ` itimerspec ^ lock ^ 

mq attr ^ passwd ^ sched, param ^ ey ^ sigevent ` siginfo t ^ sival ^ 

stat ^ termio ^ timespec ` utimbuf) ， 只 有 siginfo_t 是 使 用 typedef 定 义 的 。 
Posix.1 给 它 的 所 有 简单 系统 数据 类 型 (pid_t ` pthread t®) 的 名 字 添 上 _t 
后 级 ， 但 它们 没有 一 个 必须 是 结构 ， Posix.1 也 没有 给 这 些 数据 类 型 的 任何 
一 个 定义 结构 成 员 名 。 因 此 把 一 个 必须 是 结构 的 数据 类 型 定义 为 加 _t 后 组 
的 siginfo_t 寻 致 作者 认为 是 一 个 错误 。 这 个 古怪 现象 的 原因 也 许 是 因为 
siginfo_t 是 由 SVR4 定 义 的 ， 后 来 Posix 一 直 名 略 它 ， 直 到 发 展 到 P1003.4 实 
时 扩展 为 止 。 事 实 上 1003.1b- 1993 第 354 页 次 到 该 名 字 破 不 了 约定 ， 所 列 的 
原因 是 为 了 遵循 已 有 的 实践 ， 从 而 提高 可 移植 性 


[8]. 无 论 何 时 处 理 不 止 一 种 实时 信和 号， 我们 都 必须 给 每 种 实时 信号 的 信号 
处 理 函 数 指定 一 个 sa_mask 值 ， 该 掩 码 应 该 阻塞 所 有 剩余 的 值 较 大 的 (GU 
优先 级 较 低 的 ) 实时 信号 。Posix 规 则 保证 当 有 多 种 实时 信和 号 待 处 理 时 ， 值 
最 小 的 信和 号 最 先 递 艾 ， aea A 先 级 的 实时 信和 号 不 中 断 当 前 信号 处 
us cr ms 责任 。 我 们 通过 给 信号 处 理 函 数 指定 一 个 sa_mask 值 来 

| 这 一 点 


[9], 既然 本 例子 中 所 有 三 种 实时 信号 都 从 信号 处 理 画 数 中 相互 阻塞 了 ， 也 
就 是 说 在 执行 某 个 信号 的 处 理 画 数 期 间 ， 其 他 信号 不 会 递交 ， 因 而 不 会 中 
类 当前 信号 处 型 数 的 执行 ， 议 种 情况 下 把 prinf 作 为 一 个 简单 的 诊断 工具 
来 调用 也 许可 行 。 然而 给 出 各 个 信号 递交 顺序 的 更 好 技巧 之 一 是 按 下 述 修 
改 图 5-17。 首 先 分 配 两 个 全 局 变 


[10], 此 处 为 UNPv1 第 2 版 英文 原版 书页 码 ， 第 3 版 为 第 388 页 。 一 -一 编者 注 


7.1 概述 


从 本 章 开 始 关于 同步 的 讨论 : 怎样 同步 多 个 线程 或 多 个 进程 的 活 
动 。 为 允许 在 线程 或 进程 间 共 享 数据 ， 同 步 通常 是 必需 的 。 互 不 锁 和 
条 件 变量 是 同步 的 基本 组 成 部 分 。 

互 斥 锁 和 条 件 变 量 出 自 Posix.1 线 程 标准 ， 它 们 总 是 可 用 来 同步 一 
个 进程 内 的 各 个 线程 的 。 如 果 一 个 互 斥 锁 或 条 件 变 量 存放 在 多 个 进程 
间 共 享 的 某 个 内 存 区 中 ， 那 么 Posix 还 允许 它 用 于 这 些 进 程 间 的 同步 。 

这 在 Posix 是 个 选项 ， 在 Unix 98 却 是 必需 的 (参见 图 1-5 中 IPC 类 型 
为 “进程 间 共 享 的 互 斥 锁 / 条 件 变量 ”的 那 一 行 ) 。 

本 章 中 我 们 将 介绍 经 典 的 生产 者 -消费 者 问题 ， 并 在 解决 该 问题 的 
方案 中 使 用 互 斥 锁 和 条 件 变量 。 对 于 本 例子 ， 我 们 使 用 多 个 线程 而 不 
是 多 个 进程 ， 因 为 让 多 个 线程 共享 本 问题 中 采用 的 公共 数据 缓冲 区 非 
常 简单 ， 而 在 多 个 进程 间 共 享 一 个 公共 数据 缓冲 区 却 需要 某 种 形式 的 
共享 内 存 区 (将 在 第 4 部 分 中 讲述 ) 。 我 们 将 在 第 10 章 中 提供 使 用 信和 号 
量 解决 该 问题 的 其 他 方案 。 


7.2 互 斥 锁 : 上 锁 与 解锁 


互 斥 锁 指 代 相 互 排斥 (mutual exclusion) ， 它 是 最 基本 的 同步 形 
式 。 互 斥 锁 用 于 保护 临界 区 (critical region) ， 以 保证 任何 时 刻 只 有 一 
个 线程 在 执行 其 中 的 代码 〈 假 设 互 斥 锁 由 多 个 线程 共享 ) ， 或 者 任何 
时 刻 只 有 一 个 进程 在 执行 其 中 的 代码 〈 假 设 互 斥 锁 由 多 个 进程 共 
享 ) 。 保 护 一 个 临界 区 的 代码 的 通常 轮廓 大 体 如 下 : 

lock the mutex(...); 

临界 区 

unlock the mutex(...); 

既然 任何 时 刻 只 有 一 个 线程 能 够 锁 住 一 个 给 定 的 互 斥 锁 ， 于 是 这 
样 的 代码 保证 任何 时 刻 只 有 一 个 线程 在 执行 其 临界 区 中 的 指令 。 

Posix 互 不 锁 被 声明 为 具有 pthread_mutex_t 数 据 类 型 的 变量 。 如 果 
互 不 锁 变量 是 静态 分 配 的 ， 那 么 我 们 可 以 把 它 初始 化 成 第 值 
PTHREAD_MUTEX_INITIALIZER， 例 如 : 

static pthread mutex t lock = PTHREAD_MUTEX_INITIALIZER; 

如 果 互 斥 锁 是 动态 分 配 的 (例如 通过 调用 malloc) ， 或 者 分 配 在 共 
享 内 存 区 中 ， 那 么 我 们 必须 在 运行 之 时 通过 调用 pthread_mutex_init 函 数 
来 初始 化 它 ， 如 7.7 节 中 所 示 。 

你 可 能 会 碰 到 省 略 了 初始 化 操作 的 代码 ， 因 为 它 所 在 的 实现 把 初 

台 化 常 值 定义 为 0 〈 而 且 静 态 分 配 的 变量 被 自动 地 初始 化 为 0) 。 不 过 
这 是 不 正确 的 代码 。 
下 列 三 个 函数 给 一 个 互 斥 锁 上 锁 和 解锁 : 
#include <pthread.h> 


int pthread_mutex_lock(pthread_mutex_t *mptr); 
int pthread_mutex_trylock(pthread_mutex_t *mptr); 


int pthread_mutex_unlock(pthread_mutex_t *mptr); 


HERE: 奉 成 功 则 为 0， 夺 出 错 则 为 正 的 Exxx 值 


如 果 演 试 给 一 个 已 由 另外 某 个 线程 锁 住 的 互 斥 锁 上 锁 ， 那 么 
pthread_mutex_lock+} SH 38 2) 1% 5 FR UR BA LE ° pthread_mutex_trylock 
EXT VAYSERA SERRE, WREED, Eek l]—SEBUSY S 
TR ° 

WAR AS XE EES GR — T RJIRELE. ABA SKA E 
锁 时 ， 哪 一 个 线程 会 开始 运行 昵 ? 1003.1b-1993 标 准 增加 的 特性 之 一 是 
提供 一 个 优先 级 调度 选项 。 我 们 不 讨论 该 领域 ， 不 过 下 述 概 括 足 以 说 
明 其 内 容 : 不 同 线程 可 被 赋予 不 同 的 优先 级 ， 同 步 函 数 CAR By E 
写 锁 、 信 和 号 量 ) 将 唤醒 优先 级 最 高 的 被 阻塞 线程 。 |Butenhof 1997 | 
的 5.5 节 提供 有 关 Posix.1 实 时 调度 特性 的 具体 细节 。 

尽管 我 们 说 互 斥 锁 保 护 的 是 临界 区 ， 实 际 上 保护 的 是 在 临界 区 中 
被 操纵 的 数据 (data) 。 世 就 是 说 ， 互 不 锁 通 常用 于 保护 由 多 个 线程 或 
多 个 进程 分 享 的 共享 数据 (shared data) ° 

互 斥 锁 是 协作 性 (cooperative) 锁 。 这 就 是 说 ， 如 果 共 享 数据 是 一 
个 链表 ( 举 个 例子 ， 那 么 操纵 该 链表 的 所 有 线程 都 必须 在 实际 操纵 
前 获取 该 互 不 锁 。 不 过 也 没有 办 法 防止 某 个 线程 不 自 完 获取 该 互 不 锁 
就 操纵 该 链表 。 


7.3 生产 者 一 消费 者 问题 


同步 中 有 一 个 称 为 生产 者 一 消费 者 (producer-consumer) 问题 的 经 
典 问题 ， 也 称 为 有 界 缓冲 区 (bounded buffer) 问题 。 一 个 或 多 个 生产 
者 (线程 或 进程 创建 着 一 个 个 的 数据 条 目 ， 然 后 这 些 条 目 由 一 个 或 
多 个 消费 者 (线程 或 进程 ， 人 处 理 。 数 据 条 目 在 生产 者 和 消费 者 之 间 是 
使 用 某 种 类 型 的 IPC 传 递 的 。 

我 们 一 直 使 用 Unix 管 道 处 理 这 个 问题 。 这 就 是 说 ， 如 下 的 shell 管 
道 就 是 这 样 的 问题 ; 


grep pattern chapters.* | wc -l 

grepzé EP, wE SARS ° Unix £8 AF aa IPC 
形式 。 生 产 者 和 消费 者 间 所 需 的 同步 是 由 内 核 以 一 定 方式 处 理 的 ， 内 
核 以 这 种 方式 处 理 生 产 者 的 write 和 消费 者 的 read。 如 有 果 生 产 者 超前 消费 
者 (也 就 是 管道 被 填 满 ， 内 核 就 在 生产 者 调用 write 时 把 它 投 入 睡 
卢 ， 直 到 管道 中 有 空余 空间 。 如 果 消 费 者 超前 生产 者 (也 就 是 管道 为 
空 ) ， 内 核 就 在 消费 者 调用 read 时 把 它 投入 睡眠 ， 直 到 管道 中 有 一 些 数 
据 为 止 。 

这 些 类 型 的 同步 是 隐 式 的 (implicit) ; 也 就 是 说 生产 者 和 消费 者 
甚至 不 知道 内 核 在 执行 同步 。 如 果 我 们 改 用 Posix 消 息 队 列 或 System V 
消息 队列 作为 生产 者 和 消费 者 间 的 IPC 形 式 ， 那 么 内 核 仍 然 会 处 理 同 
IP o 

然而 当 共 至 内 存 区 用 作 生 产 者 和 消费 者 之 间 的 IPC 形 式 时 ， 生 产 者 
和 消费 者 必须 执行 某 种 类 型 的 显 式 (explicit) 同步 。 我 们 将 使 用 互 斥 
锁 展示 显 式 同步 。 图 7-1 展 示 了 我 们 使 用 的 例子 。 


ON sl dd S IEEE Nh a Ne EE E EN, " 
buff[0]: 
buff[1]: 
buff[2]: 
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条 日 


buff [nitems-1]: 
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图 7-1 生产 者 -消费 者 例子 ， 多 个 生产 者 线程 、 单 个 消费 者 线程 
在 单个 进程 中 有 多 个 生产 者 线程 和 单个 消费 者 线程 。 整 数 数组 buff 
含有 被 生产 和 消费 的 条 目 (也 就 是 共享 数据 ) 。 为 简单 起 见 ， 生 产 者 


只 是 把 buff[0] 设 置 为 0， 把 buff[1] 设 置 为 1， 如 此 等 等 。 消 费 者 只 是 沿 着 
该 数组 行进 ， 并 验证 每 个 数组 元 素 都 是 正确 的 。 

在 第 一 个 例子 中 ， 我 们 只 关心 多 个 生产 者 线程 之 间 的 同步 。 直 到 
所 有 生产 者 线程 都 完成 工作 后 ， 我 们 才 局 动 消费 者 线程。 图 7-2 是 这 个 
例子 的 main 函 数 。 

线程 间 共 享 的 全 局 变量 

47-12 这 些 变 量 是 各 个 线程 间 共 享 的 。 我 们 把 它们 以 及 相应 的 互 不 
锁 收 集 到 一 个 名 为 shared 的 结构 中 ， 目 的 是 为 了 强调 这 些 变 量 只 应 该 在 
拥有 其 互 斥 锁 时 访问 。nput 是 buff 数 组 中 下 一 次 存放 的 元 素 下 标 ，nval 
是 下 一 次 存放 的 值 (0、1、2 等 ; 。 我 们 分 配 这 个 结构 ， 并 初始 化 其 中 
用 于 生产 者 线程 间 同 步 的 互 斥 锁 。 

我 们 将 如 本 例子 所 做 的 那样 一 直 努 力 地 把 共享 数据 和 它们 的 同步 
变量 (APM. KFS SRS ES) 收集 到 一 个 结构 中 ， 这 是 一 个 很 
好 的 编程 搁 巧 。 然 而 在 许多 情况 下 共享 数据 是 动态 分 配 的 ， 壁 如 说 一 
个 链表 。 我 们 可 以 把 该 链表 的 头 以 及 该 链表 的 同步 变量 存放 到 一 个 结 
构 中 (图 5-20 中 的 mq_hdr 结 构 就 是 这 么 一 回 事 ) ， 但 是 其 他 共享 数据 

(该 链表 的 其 余部 分 ) 却 不 在 该 结构 中 。 因 此 这 种 办 法 通常 是 不 完善 
Hy ° 

命令 行 参 数 

197-22 第 一 个 命令 行 参 数 指定 生产 者 存放 的 条 目 数 ， 下 一 个 参数 
指定 行 创建 生产 者 线程 的 数目 。 

设置 并 发 级 别 

23 我 们 的 set_concurrency 范 数 告 诉 线程 系统 我 们 希望 并 发 运行 多 少 
线程 。 在 Solaris 2.6 下 ， 该 芳 数 只 是 调用 thr_setconcurrency， 当 我 们 项 
望 多 个 生产 者 线程 中 每 一 个 都 有 执行 机 会 时 ， 这 个 函数 是 必需 的 。 如 
果 我 们 在 Solaris 下 省 略 该 调用 ， 那 么 只 有 第 一 个 生产 者 线程 运行 。 在 


Digital Unix 4.0B 下 ， 我 们 的 set_concurrency 函 数 不 做 任何 事 (因为 默认 
情况 下 ， 一 个 进程 中 的 各 个 线程 竞争 使 用 处 理 器 ) o 

Unix 98 需 要 一 个 名 为 pthread_setconcurrency 的 落 数 执行 同样 的 功 
能 。 在 把 多 个 用 户 线程 (使 用 pthread_create 创 建 的 对 象 ) 复 用 到 较 小 的 
一 组 内 核 执 行 实体 〈 例 如 内 核 线 程 ) 上 的 线程 实现 中 ， 该 函数 是 需要 
的 。 这 些 实现 经 常 被 称 为 多 对 少 、 两 级 或 M 对 N 实 现 。 | butenhof 
1997] 的 5.6 节 详细 讨论 了 用 户 线程 和 内 核实 体 间 的 关系 。 
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mutex/prodcons2.c 
#include "unpipc.h" 


#define MAXNITEMS 1000000 
#define MAXNTHREADS 100 


int nitems; /* read-only by producer and consumer */ 
struct { 
pthread_mutex_t mutex; 
int buff [MAXNITEMS] ; 
int nput ; 
int nval; 
} shared = { 
PTHREAD MUTEX INITIALIZER 
h 


void *produce(void *), *consume(void *); 


int 
main(int argc, char **argv) 
{ 
int i, nthreads, count [MAXNTHREADS] ; 
pthread t tid produce[MAXNTHREADS], tid consume; 


if (arge != 3) 

err quit("usage: prodcons2 <#items> <#threads>") ; 
nitems = min(atoi(argv[1]), MAXNITEMS) ; 
nthreads = min(atoi(argv[2]), MAXNTHREADS) ; 


Set_concurrency (nthreads) ; 
/* start all the producer threads */ 
for (i = 0; i « nthreads; i++) { 
count [i] = 0; 
Pthread create(&tid produce[i], NULL, produce, &count [i]) ; 


/* wait for all the producer threads */ 
for (i = 0; i « nthreads; i++) { 

Pthread join(tid produce [i], NULL); 

printf("count[$d] = %d\n", i, count[il); 


/* start, then wait for the consumer thread */ 
Pthread create(&tid consume, NULL, consume, NULL); 
Pthread join(tid consume, NULL); 


exit(0); 


) 


mutex/prodcons2.c 


图 7-2 maine av 


创建 生产 者 线程 

24--28 创建 生产 者 线程 ， 每 个 线程 执行 produce。 在 tid_produce 数 
组 中 保存 每 个 线程 的 线程 ID 。 传 递 给 每 个 生产 者 线程 的 参数 是 指 回 
count 数 组 中 某 个 元 素 的 指针 。 我 们 首先 把 该 计数 器 初始 化 为 0， 人 然后 每 


个 线程 在 每 次 往 缓冲 区 中 存放 一 个 条 目 时 给 这 个 计数 右 加 1。 当 一 切 生 
产 完 毕 时 ， 我 们 输出 这 个 计数 絮 数 组 各 元 素 的 值 ， 以 查看 每 个 生产 者 
线程 分 别 存 放 了 多 少 条 目 。 

等 待 生产 者 线程 ， 然 后 启动 消费 者 线程 

29~ 36 等 待 所 有 生产 者 线程 终止 ， 同 时 输出 每 个 线程 的 计数 妖 
值 ， 此 后 才 启 动 单个 的 消费 者 线程 。 这 是 我 们 (和 暂时) 避免 生产 者 和 
消费 者 之 间 的 同步 问题 的 办 法 。 接 着 等 待 消费 者 完成 ， 然 后 终止 进 
程 。 

图 7-3 给 出 了 这 个 例子 所 用 的 produce 和 consume 玉 数 。 


mutex/prodcons2.c 


39 void * 

40 produce (void *arg) 

41 ( 

42 for x gy d 

43 Pthread mutex lock(&shared.mutex); 

44 if (shared.nput »- nitems) 

45 Pthread mutex unlock (&shared.mutex) ; 
46 return (NULL); /* array is full, we're done */ 
47 

48 shared.buff[shared.nput] = shared.nval; 
49 shared.nput4-*; 

50 shared.nval++; 

51 Pthread_mutex_unlock (&shared.mutex) ; 

52 *((int *) arg) += 1; 

53 } 

54 } 

55 void * 

56 consume (void *arg) 

57 

58 int i; 

59 for (i = 0; i « nitems; i++) ( 

60 if (shared.buff[i] != i) 

61 printf("buff[$d] = d\n", i, shared.buff[i]) ; 
62 } 

63 return (NULL) ; 

64 } 


mutex/prodcons2.c 


图 7-3 producefllconsume lk ži 


产生 数据 条 目 
42~53 生产 者 的 临界 区 由 用 来 测试 是 否 一 切 生产 完毕 的 条 件 语 名 
if (shared.nput >= nitems) 


和 随后 的 三 行 


shared.buff[shared.nput] = shared.nval; 

shared.nput++; 

shared.nval++; 

构成 。 

我 们 用 一 个 互 斥 锁 保 护 该 临界 区 ， 同 时 保证 在 一 切 生 产 完毕 的 情 
况 下 给 该 互 斥 锁 解 锁 。 注 意 count 元 素 的 增加 (通过 指针 arg) 不 属于 该 
临界 区 ， 因 为 每 个 线程 有 各 自 的 计数 器 《main 函数 中 的 count 数 组 ) 
既然 如 此 ， 我 们 束 不 把 这 行 代码 包括 在 由 互 不 锁 锁 住 的 临界 区 中 ， 
为 作为 一 个 通用 的 编程 原则 ， 我 们 总 是 应 该 努力 减少 由 一 个 互 不 锁 锁 
住 的 代码 量 。 

消费 者 验证 数组 的 内 容 

59~ 62 消费 者 只 是 验证 buff 数 组 中 的 每 个 条 目 是 否 正 确 ， 者 发 现 
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行 ， 而 且 是 在 所 有 生产 者 线程 都 完成 之 后 ， 因 此 不 需要 任何 同步 。 

指定 一 百 万 个 条 目 和 5 个 生产 者 线程 运行 上 述 程 序 ， 结 果 如 下 : 

solaris 96 prodcons2 1000000 5 

count[0] = 167165 

count[1] = 249891 

count[2] = 194221 

count[3] = 191815 

count[4] = 196908 

正如 我 们 所 提 ， 如 果 在 Solaris 2.6 下 去 掉 set_concurrency 调 用 ， 那 么 
count[0] 将 变 为 1000000， 其 余 计数 器 则 都 是 0。 

要 是 我 们 删除 本 例子 中 的 互 斥 锁 上 锁 ， 那 么 它 将 如 期 地 失败 。 也 
就 是 说 ， 消 费 者 将 检测 出 许多 buff[i 不 等 于 i 的 情况 。 我 们 还 可 以 验证 ， 
如 宁 只 有 一 个 生产 者 线程 在 运行 ， 那 么 删除 互 斥 锁 上 锁 并 没有 影响 。 


7.4 对 比 上 锁 与 等 待 


现在 展示 互 乒 锁 用 于 上 锁 (1ocking) 而 不 能 用 于 等 签 
(waiting) 。 我 们 把 上 一 节 中 的 生产 者 -消费 者 例子 改 为 在 所 有 生产 者 
线程 都 启动 后 立即 启动 消费 者 线程 。 这 样 在 生产 者 线程 产生 数据 的 同 
时 ， 消 费 者 线程 就 能 处 理 它 ， 而 不 是 像 图 7-2 中 那样 ， 消 费 者 线程 直到 
所 有 生产 者 线程 都 完成 后 才 启 动 。 但 现在 我 们 必须 同步 生产 者 和 消费 
者 ， 以 确保 消费 者 只 处 理 已 由 生产 者 存放 的 数据 条 目 。 
图 7-4 给 出 了 main 函 数 。 在 main 声 明之 前 的 所 有 行 与 图 7-2 中 的 一 
样 。 


mutex/prodcons3.c 


14 int 

15 main(int argc, char **argv) 

16 ( 

T7 int i, nthreads, count [MAXNTHREADS] ; 

18 pthread t tid produce [MAXNTHREADS], tid consume; 
19 if (argc != 3) 

20 err quit("usage: prodcons3 <#items> <#threads>") ; 
A nitems - min(atoi(argv[1]), MAXNITEMS); 

22 nthreads - min(atoi(argv[2]), MAXNTHREADS); 

23 /* create all producers and one consumer */ 

24 Set concurrency (nthreads + 1); 

25 for (i = 0; i < nthreads; i++) { 

26 count [i] = 0; 

27 Pthread create(&tid produce[i], NULL, produce, &count[il); 
28 ) 

29 Pthread create(&tid consume, NULL, consume, NULL) ; 
30 /* wait for all producers and the consumer */ 
31 for (i = 0; i « nthreads; i++) { 

32 Pthread_join(tid_produce [i], NULL); 

33 printf ("count [td] = d\n", i, count[il); 

34 } 

35 Pthread_join(tid_consume, NULL) ; 

36 exit (0); 

37} 


mutex/prodcons3.c 


图 7-4 main 醒 数 ， 启 动 生产 者 后 立即 启动 消费 者 
24 给 并 发 级 别 加 1， 把 额外 的 消费 着 线程 也 计算 在 内 。 


25~29 创建 生产 者 线程 后 ， 立 即 创建 消费 者 线程 。 
produce 函 数 没 有 变化 ， 已 在 图 7-3 中 给 出 。 
7-524 Ht f consume žit, "E VS] FH 354] ST RE S. HJ consume. wait EK 
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54 void 

55 consume wait(int i) 

56 ( 

57 bor [ 7 PO) ( 

58 Pthread mutex lock (&shared.mutex) ; 

59 if (i « shared.nput) ( 

60 Pthread mutex unlock (&shared.mutex); 
61 return; /* an item is ready */ 
62 ) 

63 Pthread mutex unlock (&shared.mutex) ; 

64 } 

65 } 

66 void * 

67 consume (void *arg) 

68 

69 int i; 

70 for (i = 0; i < nitems; i++) { 

vee consume_wait (i) ; 

72 if (shared.buff[i] != i) 

73 printf ("buff [d] = d\n", i, shared.buff[il); 
74 } 

75 return (NULL) ; 

76 } 
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图 7-5 consume waitfllconsumel Zi 

消息 者 必须 等 待 

71 consume 函 数 的 唯一 变动 是 在 从 buff 数 组 中 取出 下 一 个 条 目 之 前 
调用 consume_wait ° 

等 待 生产 者 

57~64 我 们 的 consume_wait 范 数 必 须 等 待 到 生产 者 产生 了 第 i 个 条 
目 。 为 检查 这 种 条 件 ， 先 给 生产 者 的 互 不 锁 上 锁 ， 再 比较 i 和 生产 者 的 
nput 下 标 。 我 们 必须 在 查看 nput 前 获得 互 不 锁 ， 因 为 某 个 生产 者 线程 当 
时 可 能 正 处 于 更 狐 该 变量 的 过 程 中 。 


这 里 的 基本 问题 是 : 当期 待 的 条 目 尚 未 准备 好 时 ， 我 们 能 做 些 什 
么 ? 图 7-5 中 的 做 法 是 一 次 次 地 循环 ， 每 次 给 互 不 锁 解 锁 又 上 锁 。 这 称 
为 轮转 (spinning) 或 轮 询 (polling) ， 是 一 种 对 CPU 时 间 的 浪费 。 

我 们 也 许可 以 睡眠 很 短 的 一 段 时 间 ， 但 是 不 知道 该 睡眠 多 久 。 这 
儿 所 需 的 是 另 一 种 类 型 的 同步 ， 它 允许 一 个 线程 (或 进程 ;睡眠 到 发 
生 某 个 事件 为 止 。 


7.5 REPRE: 等 竺 与 信号 发 送 


互 不 锁 用 于 上 锁 ， 条 件 变量 则 用 于 等 待 。 这 两 种 不 同类 型 的 同步 
都 是 需要 的 。 

条 件 变 量 是 类 型 为 pthread_cond_t 的 变量 ， 以 下 两 个 函数 使 用 了 这 
些 变量 。 


#include <pthread.h> 
int pthread_cond_wait(pthread_cond_t *cptr,pthread_mutex_t *mptr); 
int pthread_cond_signal(pthread_cond_t *cptr); 
Ej]: 者 成 功 则 为 0， 者 出 错 则 为 正 的 Exxx 值 
其 中 第 二 个 函数 的 名 字 中 的 “signal” 一 词 指 的 不 是 Unix SIGxxx 信 


Jl 


这 两 个 函数 所 等 符 或 由 之 得 以 通知 的 “条 件 ”， 其 定义 由 我 们 选 
择 : 我 们 在 代码 中 测试 这 种 条 件 。 

每 个 条 件 变 量 总 是 有 一 个 互 乓 锁 与 之 关联 。 我 们 调用 
pthread_cond_wait 等 竺 某 个 条 件 为 真 时 ， 还 会 指定 其 条 件 变量 的 地 址 和 
所 关联 的 互 不 锁 的 地 址 。 

我 们 通过 重新 编写 上 一 节 中 的 例子 来 解释 条 件 变量 的 使 用 。 图 7-6 


给 出 了 全 局 变量 的 声明 。 
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1 #include "unpipc.h" 

2 #define MAXNITEMS 1000000 

3 #define MAXNTHREADS 100 

4 /* globals shared by threads */ 

5 int nitems; /* read-only by producer and consumer */ 

6 int buff [MAXNITEMS] ; 

7 struct ( 

8 pthread mutex t mutex; 

9 int nput; /* next index to store */ 
10 int nval; /* next value to store */ 
Jib put m f 
12 PTHREAD MUTEX INITIALIZER 
13 E 


14 struct { 


15 pthread mutex t mutex; 

16 pthread cond t cond; 

17 int nready; /* number ready for consumer */ 
18 ) nready = ( 

19 PTHREAD MUTEX INITIALIZER, PTHREAD COND INITIALIZER 

20 ); 


mutex/prodcons6.c 


图 7-6 使 用 条 件 变 量 的 生产 者 -消费 者 程序 全 局 变量 

把 生产 者 变量 和 互 斥 锁 收 集 到 一 个 结构 中 

7~13 把 互 斥 锁 变量 mutex 以 及 与 之 关联 的 两 个 变量 nput 和 mnval 收 集 
到 一 个 名 为 put 的 结构 中 。 生 产 者 使 用 这 个 结构 。 

把 计数 器 、 条 件 变量 和 互 斥 锁 收 集 到 一 个 结构 中 

14720 下 一 个 结构 含有 一 个 计数 器 、 一 个 条 件 变量 和 一 个 互 不 
锁 。 我 们 把 条 件 变量 初始 化 为 PTHREAD_COND INITIALIZER ° 

main 函 数 没 有 变动 ， 已 在 图 7-4 中 给 出 。 

produce 和 consume 函 数 变 动 了 了， 在 图 7-7 中 给 出 。 

往 数 组 中 放置 下 一 个 条 目 

507-58 当 生 产 者 往 数 组 buff 中 放置 一 个 新 条 目 时 ， 我 们 改 用 互 不 
锁 put.mutex 来 为 临界 区 上 锁 。 
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46 void * 

47 produce (void *arg) 

48 { 

49 for ft ¢ 

50 Pthread_mutex_lock (&put .mutex) ; 

51 if (put.nput >= nitems) { 

52 Pthread_mutex_unlock (&put .mutex) ; 
53 return (NULL) ; /* array is full, we're done */ 
54 } 

55 buff [put .nput] = put.nval; 

56 put .nput++; 

57 put .nval++; 

58 Pthread mutex unlock (&put .mutex) ; 

59 Pthread_mutex_lock (&nready.mutex) ; 

60 if (nready.nready == 0) 

61 Pthread cond signal (&nready.cond) ; 
62 nready .nready++; 

63 Pthread_mutex_unlock (&nready.mutex) ; 
64 *((int *) arg) += 1; 

65 } 

66 } 

67 void * 

68 consume (void *arg) 

69 

70 int i; 

71 for (i = 0; i < nitems; i++) { 

72 Pthread_mutex_lock (&nready.mutex) ; 

73 while (nready.nready == 0) 

74 Pthread cond wait (&nready.cond, &nready.mutex) ; 
75 nready.nready--; 

76 Pthread mutex unlock (&nready.mutex) ; 
77 if (buff[i] != i) 

78 printf("buff[$d] = d\n", i, buff[il); 
79 } 

80 return (NULL) ; 

81 } 
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图 7-7 producefllconsume EH 2X 

通知 消费 者 

59 ~ 64 给 用 来 统计 准备 好 由 消费 者 处 理 的 条 目 数 的 计数 妖 
nready.nready Jl 1 » 在 加 1 之 前 ， 如 果 该 计数 娇 的 值 为 0， 那 束 调 用 
pthread_cond_signal 唤 醒 可 能 正在 等 待 其 值 变 为 非 零 的 任意 线程 (如 消 
BA) 。 现 在 可 以 看 出 与 该 计数 器 关联 的 互 斥 锁 和 条 件 变量 的 相互 作 
用 。 该 计数 器 是 在 生产 者 和 消费 者 之 间 共 至 的 ， 因 此 只 有 锁 住 与 之 关 


联 的 互 斥 锁 (nready.mutex) 时 才能 访问 它 。 与 之 关联 的 条 件 变 量 则 用 
等 待 和 发 送信 号。 

消费 者 等 待 nready.nready 变 为 非 零 

72-76 消费 者 只 是 等 竺 计数 需 nready.nready 变 为 非 堆 。 既 然 该 计数 
器 是 在 所 有 的 生产 者 和 消费 者 之 间 共 部 的， 那么 只 有 锁 住 与 之 关联 的 
互 不 锁 (nready.mutex) 时 才能 测试 它 的 值 。 如 果 在 锁 住 该 互 斥 锁 期 间 
该 计数 器 的 值 为 0， 我 们 就 调用 pthread_cond_wait 进 入 睡眠 。 该 函数 原 
子 地 执行 以 下 两 个 动作 : 

(1) 给 互 不 锁 nready.mutex 解 锁 ，; 

(2) 把 调用 线程 投入 睡眠 ， 直 到 男 外 某 个 线程 就 本 条 件 变 量 调用 
pthread cond signal ° 

pthread_cond_wait 在 返回 前 重新 给 互 不 锁 nready.mutex 上 锁 。 因 此 
当 它 返回 并 且 我 们 发 现 计 数 硕 nreadynready 不 为 0 时 ， 我 们 将 把 该 计数 
器 减 1 (前 提 是 我 们 肯定 已 锁 住 了 该 互 不 锁 ) ， 然 后 给 该 互 斥 锁 解 锁 。 
注意 ， 当 pthread_cond_wait 返 回 时 ， 我 们 总 是 再 次 测试 相应 条 件 成 立 与 
否 ， 因 为 可 能 发 生 虚 假 的 (spurious) Mee: 期待 的 条 件 尚 不 成 立时 的 
唤醒 。 各 种 线程 实现 都 试图 最 大 限度 减少 这 些 虚 假 唤醒 的 数量 ， 但 是 
仍 有 可 能 发 生 。 

总 的 来 说 ， 给 条 件 变量 发 送信 号 的 代码 大 体 如 下 : 


struct { 


pthread mutex t mutex; 
pthread cond t cond; 
维护 本 条 件 的 各 个 变量 
.Va...PTHREAD MUTEX INITIALIZER,PTHREAD COND INITIA 
LIZER,...}; 


Pthread mutex lock(&var.mutex); 


设置 条 件 为 真 


Pthread cond signal(&var.cond); 

Pthread mutex unlock(&var.mutex); 

在 我 们 的 例子 中 ， 用 来 维护 条 件 的 变量 是 一 个 整数 计数 三， 设置 
条 件 的 操作 就 是 给 该 计数 絮 加 1。 我们 做 了 优化 处 理 ， 即 只 有 该 计数 妖 
从 0 变 为 1 时 才 发 出 条 件 变 量 信号 。 

测试 条 件 并 进入 睡眠 以 等 待 该 条 件 变 为 真 的 代码 大 体 如 下 : 

Pthread mutex lock(&var.mutex); 

while (条 件 为 假 ) 

Pthread cond wait(&var.cond,&var.mutex); 

修改 条 件 

Pthread mutex unlock(&var.mutex); 

避免 上 锁 神 突 

在 刚刚 给 出 的 代码 片段 以 及 图 7-7 中 ，pthread_cond_signal 由 当前 锁 
住 某 个 互 斥 锁 的 线程 调用 ， 而 该 互 斥 锁 是 与 本 函数 将 给 它 发 送信 号 的 
条 件 变 量 关 联 的 。 我 们 可 以 设想 下 最 坏 情 况 ， 当 该 条 件 变量 被 发 送信 
号 后 ， 系 统 立 即 调度 等 竺 在 其 上 的 线程 ， 该 线程 开始 运行 ， 但 立即 停 
止 ， 因 为 它 没 能 获取 相应 的 互 不 锁 。 为 避免 这 种 上 锁 冲 突 ， 图 7-7 中 的 
代码 可 作 如 下 变动 : 


int dosignal; 


Pthread mutex lock(&nready.mutex); 

dosignal = (nready.nready == 0); 

nready.nready++; 

Pthread_mutex_unlock(&neready.mutex);if (dosignal) 

Pthread_cond_signal(&nready.cond); 

在 这 儿 ， 我 们 直到 释放 互 斥 锁 nready.mutex 后 才 给 与 之 关联 的 条 件 
变 量 nready.cond 发 送信 号 。pPosx 明 人 确 允 许 这 么 做 : 调用 
pthread_cond_signal 的 线程 不 必 是 与 之 关联 的 互 斥 锁 的 当前 属 主 。 不 过 


Posix 接着 说 : 如 果 需 要 可 预见 的 调度 行为 ， 那 么 调用 
pthread_cond_signal 的 线程 必须 锁 住 该 互 不 锁 。 


7.6 FR 量 : AER 和 = 


通常 pthread_cond_signal H Ife We 5 fs XE MAMRE Ee 
程 。 在 某 些 情况 下 一 个 线程 认定 有 多 个 其 他 线程 应 被 唤醒 ， 这 时 它 可 
调用 pthread_cond_broadcast 唤 醒 阻 塞 在 相应 条 件 变量 上 的 所 有 线程 。 

有 多 个 线程 应 唤醒 的 情形 的 例子 之 一 发 生 在 我 们 将 在 第 8 章 中 讲述 
的 读 出 者 与 写 入 者 问题 中 。 当 一 个 写 入 者 完 成 访问 并 释放 相应 的 锁 
后 ， 它 斋 望 唤醒 所 有 排 厦 队 的 读 出 者 ， 因 为 允许 同时 有 多 个 读 出 者 访 
[A] 。 

考虑 条 件 变量 信号 单 播发 送 与 广播 发 送 的 一 种 候选 〈 且 更 为 安全 
HJ) 方式 是 坚持 使 用 广播 发 送 。 如 果 所 有 的 等 待 者 代码 都 编写 确切 ， 
只 有 一 个 等 待 者 需要 唤醒 ， 而 且 唤 醒 哪 一 个 等 待 者 无 关 紧 要 ， 那 么 可 
以 使 用 为 这 些 情况 而 优化 的 单 播发 送 。 所 有 其 他 情况 下 都 必须 使 用 广 
播发 送 。 

#include <pthread.h> 


int pthread cond broadcast(pthread cond t *cptr); 
int pthread cond timedwait(pthread cond t  *cptrpthread mutex t 
*mptr, 
const struct timespec *abstime); 
MIB] ERKIN, Æ ENA EEx E 
pthread cond timedwait 允许 线程 瓯 阻塞 时 间 设 置 一 个 限制 值 。 


abstime 参 数 是 一 个 timespec 结 构 : 


struct timespec 1 


time t tv sec; /* seconds */ 


long tv nsec; /* nanoseconds */ 

H 

该 结构 指定 这 个 函数 必须 返回 时 的 系统 时 间 ， 即 便当 时 相应 的 条 
件 变量 还 没有 收 到 信号 。 如 果 发 生 这 种 超时 情况 ， 该 函数 就 返回 
ETIMEDOUT 错 误 。 

时 间 值 是 绝对 时 间 (absolute time) ， 而 不 是 时 间 差 (time 
delta) 。 这 就 是 说 ，abstime 是 该 落 数 应 该 返回 时 刻 的 系统 时 间 一 一 自 
UTC 时 间 1970 年 1 月 1 日 子 时 以 来 流逝 的 秒 数 和 纳 秒 数 。 这 与 select ^ 
pselect 和 poll (UNPvl 第 6 章 ) 不 同 ， 它 们 都 指定 在 将 来 的 某 个 小 数秒 
数 ， 到 时 函数 应 该 返回 (select 指 定 将 来 的 微 秒 数 ，pselect 指 定 将 来 的 
纳 秒 数 ，poll 指 定 将 来 的 毫秒 数 ) 。 使 用 绝对 时 间 而 不 是 时 间 差 的 好 处 
是 : 如 果 函 数 过 早 返 回 了 (也 许 是 因为 捕获 了 某 个 信号 ) ， 那 么 同一 
函数 无 需 改 变 其 参数 中 timespec 结 构 的 内 容 就 能 再 次 被 调用 。 


7.7 互 不 锁 和 条 件 变 量 的 属性 


本 章 中 的 互 斥 锁 和 条 件 变量 例子 把 它们 作为 一 个 进程 中 的 全 局 变 
量 存 放 ， 它 们 用 于 该 进程 内 各 线程 间 的 同步 。 我 们 用 两 个 第 值 
PTHREAD MUTEX INITIALIZER 和 PTHREAD_COND INITIALIZER 
来 初始 化 它们 。 由 这 种 方式 初始 化 的 互 斥 锁 和 条 件 变量 具备 默认 属 
性 ， 不 过 我 们 还 能 以 非 默 认 属 性 初始 化 它们 。 

百 先 ， 互 矿 锁 和 条 件 变 量 是 用 以 下 函数 初始 化 或 挫 毁 的 。 

#include <pthread.h> 


int pthread_mutex_init(pthread_mutex_t *mptr,const 
pthread mutexattr t *attr); 


int pthread. mutex destroy(pthread mutex t *mptr); 


int pthread cond init(pthread cond t *cptr,const pthread condattr t 
*attr); 

int pthread cond destroy(pthread cond t *cptr); 

Ej]: 大 成 功 则 为 0， 帮 出错 则 为 正 的 Exxx 值 

考虑 互 乒 锁 情 况 ，mptr 必 须 指 同一 个 已 分 配 的 pthread_mnutex_t 变 
量 ， 并 由 pthread_mnutex_init 函 数 初 始 化 该 互 斥 锁 。 由 该 范 数 第 二 个 参数 
attr 指 回 的 pthread_mutexattr_ {t 值 指定 其 属性 。 如 果 该 参数 是 个 空 指 针 ， 
那 束 使 用 默认 属性 。 

互 太 锁 属 性 的 数据 类 型 为 pthread_mnutexattr t， 条 件 变量 属性 的 数 
据 类 型 为 pthread_condattr t, fi 1E EA P ENE IB LE EE Sx © 

#include <pthread.h> 


int pthread_mutexattr_init(pthread_mutexattr_t *attr); 

int pthread_mutexattr_destroy(pthread_mutexattr_t *attr); 

int pthread_condattr_init(pthread_condattr_t *attr); 

int pthread_condattr_destroy(pthread_condattr_t *attr); 

PIE]: 奎 成 功 则 为 0， 奉 出 错 则 为 正 的 Exxx 值 

一 旦 某 个 互 不 锁 属性 对 象 或 某 个 条 件 变 量 属性 对 象 已 被 初始 化 ， 
束 通 过 调用 不 同 函 数 启用 或 么 止 特定 的 属性 。 举 例 来 说 ， 我 们 将 在 以 
后 各 章 中 使 用 的 一 个 属性 是 : 指定 互 斥 锁 或 条 件 变量 在 不 同 进 程 间 共 
享 ， 而 不 是 只 在 单个 进程 内 的 不 同 线程 间 共 享 。 这 个 属性 是 用 以 下 画 
数 取得 或 存 入 的 。 

#include <pthread.h> 


int pthread mutexattr getpshared(const pthread_mutexattr_t *attr,int 
*valptr); 

int pthread_mutexattr_setpshared(pthread_mutexattr_t *attr,int value); 

int pthread condattr getpshared(const pthread_condattr_t *attr,int 
*valptr); 


int pthread_condattr_setpshared(pthread_condattr_t *attr,int value); 
均 返 回 : 者 成 功 则 为 0， 大 出 错 则 为 正 的 Exxx 值 
其 中 两 个 get 芳 数 返 回 在 由 valptr 指 同 的 整数 中 的 这 个 属性 的 当前 
值 ， B set 数 则 根据 value 的 值 设置 这 个 属性 的 当前 值 。value 的 值 可 


以 是 PTHREAD PROCESS PRIVATE 或 
PTHREAD PROCESS SHARED。 后 者 也 称 为 进程 间 共 
个 特性 只 在 头 文 件 <unistdh> "P E ts fü 


POSIX THREAD PROCESS SHARED 时 才 得 以 支持 。 E m d 
是 可 选 特性 ， 在 Unix 98 中 却 是 必需 的 (图 1-5) 。 

以 下 代码 片段 给 出 初始 化 一 个 互 斥 锁 以 便 它 能 在 进程 间 共 享 的 过 
fi: 


pthread mutex t *mptr; /* pointer to the mutex in shared 
memory */ 
pthread mutexattr t mattr; /* mutex attribute datatype */ 
mptr = /* some value that points to shared memory */ 


;Pthread_mutexattr_init(&mattr); 
#ifdef POSIX THREAD PROCESS SHARED 
Pthread mutexattr setpshared(&mattr,PTHREAD PROCESS SHA 


RED); 
#else 
# error this implementation does not support 
_POSIX_THREAD_PROCESS_SHARED 
#endif 


Pthread_mutex_init(mptr,&mattr); 
我 们 声明 一 个 名 为 mattr 的 pthread_mnutexattr_t 数 据 类 型 的 变量 ， 把 
它 初 始 化 成 互 乒 锁 的 默认 属性 ， 然 后 给 它 设 置 


PTHREAD_PROCESS_SHARED 属 性 ， 意 思 是 该 互 不 锁 将 在 进程 间 共 
享 。pthread_mutex_init 然 后 照 此 初始 化 该 互 不 锁 。 必 须 分 配给 该 互 不 锁 
的 共享 内 存 区 空间 大 小 为 sizeof(pthread_mutex_t)。 

用 于 给 存放 在 共享 内 存 区 中 供 多 个 进程 使 用 的 一 个 条 件 变 量 设置 
PTHREAD_PROCESS_SHARED 属 性 的 一 组 语句 跟 用 于 互 不 锁 的 语句 
几乎 相同 ， 只 需 把 其 中 的 5 处 mutex 替 换 成 cond 。 

我 们 已 在 图 5-22 中 给 出 这 些 进程 间 共 享 的 互 斥 锁 和 条 件 变量 的 例 


F 

持 有 锁 期 间 进 程 终 止 

当 在 进程 间 共 享 一 个 互 斥 锁 时 ， 持 有 该 互 斥 锁 的 进程 在 持 有 期 间 
Aik 〈 也 许 是 非 自 愿 地 ) 的 可 能 总 是 有 的 。 没 有 办 法 让 系统 在 进程 终 
止 时 自动 释放 所 持 有 的 锁 。 我 们 将 会 看 到 读 写 锁 和 Posix 信 和 号 量 也 具备 
这 种 属性 。 进 程 终 止 时 内 核 总 是 自动 清理 的 唯一 同步 锁 类 型 是 fcnt 记 录 
锁 (第 9 章 ) 。 使 用 System V 信 号 量 时 ， 应 用 程序 可 以 选择 进程 终止 时 
内 核 是 否 上 自动 清理 某 个 信和 号 量 锁 (将 在 11.3 广 中 讨论 的 SEM_UNDQ 特 
性 ) 。 

一 个 线程 也 可 以 在 持 有 某 个 互 斥 锁 期 间 终 止 ， 起 因 是 被 另 一 个 线 
程 取消 或 自己 去 调用 了 pthread_exit。 后 者 没什么 可 关注 的 ， 因 为 如 果 
该 线程 调用 pthread_exit 自 愿 终止 的 话 ， 它 应 该 知道 自己 还 持 有 一 个 互 
不 锁 。 如 果 是 被 男 一 个 线程 取消 的 情况 ， 那 么 该 线程 可 以 安装 将 在 被 
取消 时 调用 的 清理 处 理 程序 ， 如 8.5 节 中 所 展示 的 那样 。 对 于 一 个 线程 
来 说 是 致命 的 条 件 通常 还 导致 整个 进程 的 终止 。 举 例 来 说 ， 如 果 某 个 
线程 执行 了 一 个 无 效 指针 访问 ， 从 而 引发 了 SIGSEGV 信 和 号， 那么 一 旦 
该 信号 未 被 捕获 ， 整 个 进程 就 被 它 终 止 ， 我 们 于 是 回 到 了 先前 处 理 进 
程 终止 的 条 件 上 。 

即使 一 个 进程 终止 时 系统 会 自动 释放 某 个 锁 ， 那 也 可 能 解决 不 了 
问题 。 该 锁 保 护 某 个 临界 区 很 可 能 是 为 了 在 执行 该 临界 区 代码 期 间 更 


新 某 个 数据 。 如 有 果 该 进程 在 执行 该 临界 区 的 中 途 终止 ， 该 数据 处 于 什 
么 状态 昵 ? 该 数据 处 于 不 一 致 状态 的 可 能 性 很 大 : 举例 来 说 ， 一 个 新 
条 目 也 许 只 是 部 分 插入 某 个 链表 中 ， 要 是 该 进程 终止 时 内 核 仅 仅 把 那 
个 锁 解 开 的 话 ， 使 用 该 链表 的 下 一 个 进程 束 可 能 发 现 它 已 损坏 。 

然而 在 某 些 例子 中 ， 让 内 核 在 进程 终止 时 清理 某 个 锁 《大 是 信和 号 
量 情况 则 为 计数 夯 ) 不 成 问题 。 例 如 ， 某 个 服务 万 可 能 使 用 一 个 
System V 信 号 量 (打开 其 SEM_UNDO 特 性 ) 来 统计 当前 被 处 理 的 客户 
数 。 每 次 fork 一 个 于 进程 时 ， 它 整 把 该 信号 量 加 1， 当 该 子 进程 终止 
时 ， 它 再 把 该 信号 量 减 1。 如 采 该 子 进程 非 正 党 终止 ， 内 核 仍 会 把 该 计 
数 右 减 1。9.7 节 给 出 了 一 个 例子 ， 说 明 内 核 在 什么 时 候 释放 一 个 锁 (不 
ve Sa reas) 合适 。 那 儿 的 守护 进程 一 开始 就 在 目 己 的 某 个 
数据 文件 上 获得 一 个 写 入 锁 ， 然 后 在 其 运行 期 间 一 直 择 有 该 锁 。 如 采 
有 人 试图 局 动 该 守护 进程 的 男 一 个 副本 ， 那 么 新 的 副本 将 因为 无 法 取 
得 该 写 入 锁 而 终止 ， 从 而 确保 该 守护 进程 只 有 一 个 副本 在 一 直 运 行 。 
但 是 如 有 果 该 守护 进程 不 正常 地 终止 了 ， 那 么 内 核 会 释放 该 写 入 锁 ， 从 
而 允许 局 动 该 守护 进程 的 为 一 个 副本 。 


7.8 小 结 


互 不 锁 用 于 保护 代码 临界 区 ， 从 而 保证 任何 时 刻 只 有 一 个 线程 在 
临界 区 内 执行 。 有 时 候 一 个 线程 获得 某 个 互 斥 锁 后 ， 发 现 目 己 需要 等 
等 某 个 条 件 变 为 真 。 如 果 是 这 样 ， 该 线程 就 可 以 等 待 在 某 个 条 件 变量 
上 。 条 件 变 量 总 是 有 一 个 互 不 锁 与 之 关联 。 把 调用 线程 投入 睡眠 的 
pthread_cond_wait 函 数 在 这 么 做 之 前 移 给 所 天 联 的 互 斥 锁 解 锁 ， 以 后 某 
个 时 刻 唤 醒 该 线程 前 再 给 该 互 斥 锁 上 锁 。 该 条 件 变 量 由 另外 某 个 线程 
回 它 发 送信 号 ， 而 这 个 发 送信 号 的 线程 既 可 以 只 唤醒 一 个 线程 


(pthread cond signal) ， 也 可 以 唤醒 等 待 相应 条 件 变 为 真 的 所 有 线程 
(pthread cond broadcast) 。 

互 不 锁 和 条 件 变量 可 以 静态 分 配 并 静态 初始 化 。 它 们 也 可 以 动态 
分 配 ， 那 要 求 动态 地 初始 化 它们 。 动 态 初 始 化 允许 我 们 指定 进程 间 共 
享 属性 ， 从 而 允许 在 不 同 进程 间 共 享 某 个 互 不 锁 或 条 件 变 量 ， 其 前 提 
是 该 互 不 锁 或 条 件 变量 必须 存放 在 由 这 些 进程 共享 的 内 存 区 中 。 


习题 


7.1 去 挥 图 7-3 中 的 互 不 锁 ， 验 证 这 个 例子 在 运行 不 止 一 个 生产 者 线 
程 的 前 提 下 会 失败 。 

7.2 如 果 把 图 7-2 中 对 消费 者 线程 的 Pthread join 调用 去 掉 ， 那 么 会 
发 生 什 么 ? 

7.3 编写 一 个 程序 ， 在 一 个 无 限 循 环 中 只 调用 pthread_mutexattr_init 
和 pthread_condattr_init。 使 用 诸如 ps 这 样 的 程序 观察 其 进程 的 内 存 使 用 
faite RAS HA? 现在 加 上 合适 的 pthread_mnutexattr_destroy 和 
phtread_condattr_destory， 再 验证 没有 发 生 内 存 遗 漏 。 

7.4 在 图 7-7 中 ， 生 产 者 只 在 计数 虱 nready.nready 由 0 变 为 1 时 才 调 用 
pthread_cond_signal。 为 查看 这 种 优化 处 理 的 效果 ， 增 设 一 个 计数 履 
它 在 每 次 调用 pthread_cond_signal 时 加 1， 当 消费 者 完成 时 ， 在 主线 程 中 
输出 这 个 计数 絮 的 值 。 
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8 至 Ws 


8.1 概述 


互 斥 锁 把 试图 进入 我 们 称 之 为 临界 区 的 所 有 其 他 线程 都 阻 蹇 住 。 
该 临界 区 通常 涉及 对 由 这 些 线程 共享 的 一 个 或 多 个 数据 的 访问 或 更 
新 。 然 而 有 时 候 我 们 可 以 在 读 某 个 数据 与 修改 某 个 数据 之 间作 区 分 。 

我 们 现在 讲述 读 写 锁 (read-writelock) ， 并 在 获取 读 写 锁 用 于 读 
和 获取 读 写 锁 用 于 写 之 间作 区 分 。 这 些 读 写 锁 的 分 配 规 则 如 下 : 

(1) 只 要 没有 线程 持 有 某 个 给 定 的 读 写 锁 用 于 写 ， 那 么 任意 数目 的 
线程 可 以 持 有 该 读 写 锁 用 于 读 。 

(2) 仅 当 没 有 线程 持 有 某 个 给 定 的 读 写 锁 用 于 读 或 用 于 写 时 ， 才 能 
分 配 该 读 写 锁 用 于 写 。 

换 一 种 说 法 瓯 是 ， 只 要 没有 线程 在 修改 某 个 给 定 的 数据 ， 那 么 任 
意 数 目的 线程 都 可 以 拥有 该 数据 的 读 访问 权 。 仅 当 没 有 其 他 线程 在 读 
或 修改 某 个 给 定 的 数据 时 ， 当 前 线程 才 可 以 修改 它 。 

某 些 应 用 中 读数 据 比 修改 数据 频 索 ， 这 些 应 用 可 从 改 用 读 写 锁 代 
替 互 斥 锁 中 获 益 。 任 意 给 定时 刻 允 许多 个 读 出 者 存在 提供 了 更 高 的 并 
发 度 ， 同 时 在 某 个 写 入 者 修改 数据 期 间 保护 该 数据 ， 以 免 任 何其 他 读 
出 者 或 写 入 者 的 干扰 。 

这 种 对 于 某 个 给 定 资源 的 共享 访问 也 称 为 共享 一 独占 (shared- 
exclusive) 上 锁 ， 因 为 获取 一 个 读 写 锁 用 于 读 称 为 共享 锁 (shared 
lock) ， 获 取 一 个 读 写 锁 用 于 写 称 为 独占 锁 (exclusive lock) 。 有 关 这 
种 类 型 问题 《多 个 读 出 者 和 一 个 写 入 者 ) 的 其 他 说 法 有 读 出 者 与 写 入 
者 (readers and writers) 问题 以 及 多 读 出 者 一 单 写 入 者 (readers- 
writer) 锁 。 〈 最 后 一 个 说 法 的 英文 名 称 中 ，*“readers” 有 意 是 复数 ， 
“writer”“ 有 和 划 是 单数 ， 目 的 是 强调 这 种 问题 的 多 个 读 出 者 与 单个 写 入 者 
本 性 。) 

读 写 锁 的 一 个 日 常 类 比 是 访问 银行 账户 。 多 个 线程 可 以 同时 读 出 
某 个 账户 的 收文 结余 ， 但 是 一 旦 有 一 个 线程 需要 更 新 某 个 给 定 收文 结 
余 ， 该 线程 丈 必 须 等 待 所 有 读 出 者 完成 该 收文 结余 的 读 出 ， 然 后 只 人 允 


许 该 更 新 线程 修改 这 个 收文 结余 。 直 到 更 新 完 之 前 ， 任 何 读 出 者 都 不 
允许 读 该 收文 结余 。 

本 章 中 描述 的 函数 由 Unix 98 定 义 ， 因 为 读 写 锁 不 属于 1996 年 
Posix.1 标 准 的 一 部 分 。 这 些 函 数 是 在 1995 年 由 一 个 称 为 Aspen Group 的 
Unix! 家 联合 体 开 发 的 ， 同 时 开发 的 还 有 Posix.1 未 定义 的 其 他 扩充 。 
有 一 个 Posix 工 作 组 (1003.1j) 正在 开发 包括 读 写 锁 在 内 的 一 组 Pthread 
扩充 ， 它 们 很 有 可 能 与 本 章 中 讲述 的 一 样 。 


8.2 获取 与 释放 读 写 锁 


读 写 锁 的 数据 类 型 为 pthread_rwlock_t。 如 果 这 个 类 型 的 某 个 变量 
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PTHREAD_RWLOCK_INITIALIZER 来 初始 化 它 。 

pthread_rwlock_rdlock 和 获取 一 个 读 出 锁 ， 如 有 果 对 应 的 读 写 锁 已 由 某 
个 写 入 者 持 有 ， 那 就 阻塞 调用 线程 。pthread_rwlock_wrlock 获 取 一 个 写 
入 锁 ， 如 采 对 应 的 读 写 锁 已 由 另 一 个 写 入 者 持 有 ， 或 者 已 由 一 个 或 多 
个 读 出 者 持 有 ， 那 束 阻 塞 调 用 线程 。pthread_rwlock_unlock 释 放 一 个 读 
出 锁 或 写 入 锁 。 

#include <pthread.h> 

int pthread_rwlock_rdlock(pthread_rwlock_t *rwptr); 

int pthread rwlock wrlock(pthread rwlock t *rwptr); 

int pthread rwlock unlock(pthread rwlock t *rwptr); 

Ej]: 寿 成 功 则 为 0， 奎 出错 则 为 正 的 Exxx 值 
下 面 两 个 函数 笑 试 获取 一 个 读 出 锁 或 写 入 锁 ， 但 是 如 有 该 锁 不 能 

马上 取得 ， 那 就 返回 一 个 EBUSY 错 误 ， 而 不 是 把 调用 线程 投入 睡眠 。 

#include <pthread.h> 


int pthread_rwlock_tryrdlock(pthread_rwlock_t *rwptr); 


int pthread rwlock trywrlock(pthread rwlock t *rwptr); 
MIB]: EKINO, Æ EA EEx 


8.3 读 写 锁 属 性 


我 们 提 到 过 ， 可 通过 给 一 个 静态 分 配 的 读 写 锁 赋 常 值 
PTHREAD_RWLOCK_INITIALIZER 来 初始 化 它 。 读 写 锁 变量 也 可 以 通 
过 调用 pthread_rwlock_init 来 动态 地 初始 化 。 当 一 个 线程 不 再 需要 某 个 
读 写 锁 时 ， 可 以 调用 pthread_rwlock_destroy 摊 毁 它 。 

#include <pthread.h> 


int pthread_rwlock_init(pthread_rwlock_t *rwptr, 
const pthread rwlockattr t *attr); 
int pthread. rwlock destroy(pthread rwlock t *rwptr); 
均 返 回 : 寿 成 功 则 为 0， 奉 出 错 则 为 正 的 Exxx 值 
初始 化 某 个 读 写 锁 上 时， 如果 attr 是 个 空 指针 ， 那 束 使 用 默认 属性 。 
要 赋予 它 非 默认 的 属性 ， 需 使 用 下 面 两 个 函数 。 
#include <pthread.h> 


int pthread_rwlockattr_init(pthread_rwlockattr_t *attr); 
int pthread_rwlockattr_destroy(pthread_rwlockattr_t *attr); 
Ej]: ERII, ZPDSTRUJIEBJExxxfE 

数据 类 型 为 pthread_rwlockattr_t 的 某 个 属性 对 象 一 旦 初始 化 ， 就 通 
过 调用 不 同 的 函数 来 启用 或 茜 止 特定 属性 。 当 前 定义 了 的 唯一 属性 是 
PTHREAD_PROCESS_SHARED ， 它 指定 相应 的 读 写 锁 将 在 不 同 进程 
间 共 享 ， 而 不 仅仅 是 在 单个 进程 内 的 不 同 线程 间 共 享 。 以 下 两 个 男 数 
分 别 获取 和 设置 这 个 属性 。 

#include <pthread.h> 


int pthread rwlockattr getpshared(const pthread rwlockattr t *attr,int 
*valptr); 

int pthread rwlockattr setpshared(pthread rwlockattr t *attr,int value); 

PIB]: 者 成 功 则 为 0， 大 出 错 则 为 正 的 Exxx 值 

第 一 个 函数 在 由 valptr 指 同 的 整数 中 返回 该 属性 的 当前 值 。 第 二 个 
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PTHREAD PROCESS PRIVATE 或 为 
PTHREAD PROCESS SHARED ° 


8.4 使 用 互 斥 锁 和 条 件 变 量 实现 读 写 锁 


只 需 使 用 互 不 锁 和 条 件 变量 就 能 实现 读 写 锁 。 本 节 中 我 们 将 查看 
一 种 可 能 的 实现 。 这 个 实现 优先 考虑 等 待 着 的 写 入 者 。 这 不 是 必需 
的 ， 可 以 有 其 他 实现 方案 。 

本 下 和 本 章 剩余 各 世人 含有 高 级 主题 ， 第 一 次 阅读 时 你 可 和 暂时 跳 过 
去 o 

读 写 锁 的 其 他 实现 也 值得 研究 。 [Butenhof 1997] 的 7.1.2 节 提供 
了 一 个 优先 考虑 等 待 着 的 读 出 者 的 实现 ， 并 且 包 括 取消 处 理 (我 们 将 
稍 后 讨论 ) 。 [IEEE1996] 的 B.18.2.3.1 节 提供 了 男 一 个 优先 考虑 等 待 
着 的 写 入 者 的 实现 ， 也 包括 取消 处 理 。 [Kleiman,Shah,and Smaalders 
1996] 第 14 章 提供 了 一 个 优先 考虑 等 待 着 的 写 入 者 的 实现 。 本 市 给 
的 实现 来 日 Doug Schmidt 的 ACE 软 件 包 http: //www.cs.wustl.edu/ ~ 
schmidt/ACE.html (适应 性 通信 环境 ，Adaptive Communications 
Environment) 。 以 上 4 个 实现 都 使 用 互 不 锁 和 条 件 变量 。 

8.4.1 pthread_rwlock_t 数 据 类 型 

图 8-1 给 出 我 们 的 pthread_rwlockh 头 文件 ， 它 定义 了 基本 的 
pthread, rwlock t 数 据 类 型 和 操作 读 写 锁 的 各 个 函数 的 函数 原型 。 通 锁 


情况 下 它们 是 在 <pthread.h> 头 文件 中 。 


my rwlock/pthread rwlock.h 


1 #ifndef  pthread rwlock h 
2 #define _ pthread rwlock h 
3 typedef struct { 
4 pthread_mutex_t rw_mutex; /* basic lock on this struct */ 
5 pthread cond t rw condreaders; /* for reader threads waiting */ 
6 pthread cond t rw condwriters; /* for writer threads waiting */ 
9 int rw magic; /* for error checking */ 
8 int rw nwaitreaders; /* the number waiting */ 
9 int rw nwaitwriters; /* the number waiting */ 
10 int rw refcount; 
TI /* -1 if writer has the lock, else # readers holding the lock */ 
12 ) pthread rwlock t; 
13 #define RW MAGIC 0x19283746 
14 /* following must have same order as elements in struct above */ 
15 #define PTHREAD RWLOCK INITIALIZER ( PTHREAD MUTEX INITIALIZER, V 
16 PTHREAD COND INITIALIZER, PTHREAD COND INITIALIZER, \ 
17 RW MAGIC, 0, 0, 0 } 
18 typedef int pthread rwlockattr t; /* dummy; not supported */ 
19 /* function prototypes */ 
图 8-1 pthread rwlock _t 数 据 类 型 的 定义 
20 int pthread rwlock destroy(pthread rwlock t *); 
21 int pthread rwlock init(pthread rwlock t *, pthread rwlockattr t *); 
22 int pthread rwlock rdlock(pthread rwlock t *); 
28) Tat pthread rwlock tryrdlock(pthread rwlock t *); 
24 int pthread rwlock trywrlock(pthread rwlock t *); 
25 int pthread rwlock unlock(pthread rwlock t *); 
26 int pthread rwlock wrlock(pthread rwlock t *); 
27 /* and our wrapper functions */ 
28 void Pthread rwlock destroy (pthread rwlock t *); 
29 void Pthread rwlock init(pthread rwlock t *, pthread rwlockattr t *); 
30 void Pthread rwlock rdlock(pthread rwlock t *); 
31. int Pthread rwlock tryrdlock(pthread rwlock t *); 
32 int Pthread rwlock trywrlock(pthread rwlock t *); 
33 void Pthread rwlock unlock(pthread rwlock t *); 
34 void Pthread rwlock wrlock(pthread rwlock t *); 
35 #endif /* _ pthread rwlock h */ 


my rwlock/pthread rwlock.h 


图 8-1 (5) 


3~13 我 们 的 pthread_rwlock _t 数 据 类 型 含有 一 个 互 斥 锁 、 两 个 条 件 
变量 、 一 个 标志 及 三 个 计数 器 。 我 们 将 从 接 下 来 给 出 的 函数 中 看 出 所 
有 这 些 成 员 的 用 途 。 无 论 何 时 检查 或 操纵 该 结构 ， 我 们 都 必须 持 有 其 


中 的 互 斥 锁 成 员 rw_mutex。 该 结构 初始 化 成 功 后， 标志 成 员 rw_magic 
就 被 设置 成 RW_MAGIC。 所 有 函数 都 测试 该 成 员 ， 以 检查 调用 者 是 否 
回 某 个 已 初始 化 的 读 写 锁 传 递 了 指针 。 该 读 写 锁 被 拱 毁 时 ， 这 个 成 员 
PLB ENO © 

注意 计数 器 成 员 之 一 rw_refcount 总 是 指示 着 本 读 写 锁 的 当前 状 
AS: -1 表示 它 是 一 个 写 入 锁 (任意 时 刻 这 样 的 锁 只 能 有 一 个 ) ，0 表 示 
它 是 可 用 的 ， 大 于 0 的 值 则 意味 着 它 当 前 容纳 着 那么 多 的 读 出 锁 。 

14-417 给 该 数据 类 型 定义 静态 初始 化 常 值 。 

8.4.2 pthread_rwlock_init 函 数 

图 8-2 给 出 了 我 们 的 第 一 个 函数 pthread_rwlock_init， 它 动态 初始 化 
一 个 读 写 锁 。 


my rwlock/pthread rwlock init.c 


1 #include "unpipc.h" 
2 #include "pthread rwlock.h" 
3 int 


4 pthread rwlock init(pthread rwlock t *rw, pthread rwlockattr t *attr) 
5 { 


6 int result; 

7 if (attr !- NULL) 

8 return(EINVAL); /* not supported */ 

9 if ( (result = pthread mutex init(&rw-»rw mutex, NULL)) !- 0) 

10 goto errl; 

T3 if ( (result = pthread cond init(&rw-»rw condreaders, NULL)) != 0) 
12 goto err2; 

13 if ( (result = pthread cond init(&rw-»rw condwriters, NULL)) !- 0) 
14 goto err3; 

15 rw-»rw nwaitreaders = 0; 


图 8-2 pthread_rwlock_initkHaX: 初始 化 一 个 读 写 锁 


16 rw-»rw nwaitwriters = 0; 


17 rw-»rw refcount - 0; 

18 rw-»rw magic - RW MAGIC; 

19 return(0); 

20 err: 

21 pthread cond destroy(&rw-»rw condreaders); 
22 erra3: 

23 pthread mutex destroy(&rw-»rw mutex); 

24 erri: 

25 return (result); /* an errno value */ 
26 ) 


图 8-2 (5) 

7~8 我们 不 文 持 使 用 本 函数 给 读 写 锁 赋 属性 ， 因 此 检查 其 attr 是 否 
ATSB ET ° 

9~19 初始 化 由 调用 者 指定 其 指针 的 读 写 锁 结构 中 的 互 斥 锁 和 两 个 
条 件 变 量 成 员 。 所 有 三 个 计数 絮 成 员 都 设置 为 0，rw_magic 成 员 则 设置 
为 表示 该 结构 已 初始 化 完毕 的 值 。 

20~25 如 末 互 不 锁 或 条 件 变 量 的 初始 化 和 失败， 那么 小 心地 确保 挫 
毁 已 初始 化 的 对 象 ， 然 后 返回 一 个 错误 。 

8.4.3 pthread  rwlock destroy EN2A 

8-328 Hi T 3€ fi] AY pthread rwlock destroy K Zt, "E YE P 6 £x fi 

(包括 调用 者 在 内 ) 都 不 再 持 有 也 不 试图 持 有 某 个 读 写 锁 的 时 候 挫 毁 

该 锁 。8~13 首先 检查 由 调用 者 指定 的 读 写 锁 已 不 在 使 用 中 ， 然 后 给 其 
中 的 互 斥 锁 和 两 个 条 件 变 量 成 员 调 用 合适 的 挫 毁 函数 。 


my rwlock/pthread rwlock destroy.c 


1 #include "unpipc.h" 

2 #include "pthread rwlock.h" 

3 int 

4 pthread rwlock destroy (pthread rwlock t *rw) 

5 { 

6 if (rw-»rw magic !- RW MAGIC) 

7 return (EINVAL) ; 

8 if (rw->rw_refcount != 0 || 

9 rw-»rw nwaitreaders != 0 || rw-»rw nwaitwriters !- 0) 
10 return (EBUSY) ; 

11 pthread_mutex_destroy (&rw->rw_mutex) ; 

12 pthread_cond_destroy (&rw->rw_condreaders) ; 
13 pthread_cond_destroy (&rw->rw_condwriters) ; 
14 rw-»rw magic = 0; 

15 return(0); 


my rwlock/pthread rwlock destroy.c 


图 8-3 pthread rwlock destroyEXZX: JE — 1 i555 Bi 


8.4.4 pthread rwlock rdlockPk2i 
&j8-A25 Hi T Fii ]ÉJpthread rwlock rdlockEX žit ° 


my rwlock/pthread rwlock rdlock.c 


1 #include "unpipc.h" 

2 #include "pthread rwlock.h" 

3 int 

4 pthread rwlock rdlock(pthread rwlock t *rw) 

5 { 

6 int result; 

7 if (rw-»rw magic !- RW MAGIC) 

8 return (EINVAL) ; 

9 if ( (result = pthread mutex lock(&rw-»rw mutex)) != 0) 
10 return (result); 

TT /* give preference to waiting writers */ 

12 while (rw-»rw refcount < 0 || rw-»rw nwaitwriters > 0) { 
T3 rw->rw_nwaitreaders++; 

14 result = pthread cond wait(&rw-»rw condreaders, &rw-»rw mutex); 
15 rw-»rw nwaitreaders--; 

16 if (result !- 0) 

1. break; 

18 ) 

19 if (result == 0) 

20 rw->rw_refcount++; /* another reader has a read lock */ 
21 pthread_mutex_unlock (&rw->rw_mutex) ; 

22 return (result); 

23 } 


my rwlock/pthread rwlock rdlock.c 


图 8-4 pthread. rwlock rdlockERZ: 获取 一 个 读 出 锁 


9—-10 无 论 何 时 操作 pthread_rwlock_t 类 型 的 结构 ， 都 必须 给 其 中 的 
rw_mutex 成 员 上 锁 。 

117-18 如 果 (a) rw_refcount 小 于 0 (意味 着 当前 有 一 个 写 入 者 持 
有 由 调用 者 指定 的 读 写 锁 ) ， 或 者 (b) 有 线程 正 等 着 获取 该 读 写 锁 的 
一 个 写 入 锁 (rw nwaitwriters K T0) ， 那 么 我 们 无 法 获取 该 读 写 锁 的 
一 个 读 出 锁 。 如 采 这 两 个 条 件 中 有 一 个 为 真 ， 我 们 惑 把 rw_nwaitreaders 
加 1。 并 在 rw_condreaders 条 件 变 量 上 调用 pthread_cond_wait。 我 们 稍 后 
将 看 到 ， 当 给 一 个 读 写 锁 解 锁 时 ， 首 先 检 查 是 否 有 任何 等 待 着 的 写 入 
者 ， 若 没有 则 检查 是 否 有 任何 等 待 着 的 读 出 者 。 如 果 有 读 出 者 在 等 
等， 那 就 同 rw_condreaders 条 件 变量 广播 信和 号。 

19~20 取得 读 出 锁 后 把 rw_refcount 加 1。 互 不 锁 旋即 释放 。 

该 范 数 中 存在 一 个 问题 如果 调用 线程 阻塞 在 其 中 的 
pthread_cond_wait 调 用 上 并 随后 被 取消 ， 它 就 在 仍 持 有 互 不 锁 的 情况 下 
终止 ， 于 是 rw_nwaitreaders if žk # HJ (E Hi fa ° Al 8-6 中 
pthread, rwlock wrlockER25 E] Sz 3L, TE [REFERS eel o. BUTE B.5 T 24] 
正 这 些 问题 。 

8.4.5 pthread rwlock tryrdlockER2 

[8-525 E £1 JR Jpthread rwlock tryrdlockERZX, EERE 
读 出 锁 时 并 不 阻 蹇 。 

117-14 如 果 当 前 有 一 个 写 入 者 持 有 调用 者 指定 的 读 写 锁 ， 或 者 有 
线程 在 等 竺 该 读 写 锁 的 一 个 写 入 锁 ， 那 瓯 返回 EBUSY 错 误 。 人 否则 ， 通 
过 把 rw_refcount 加 1 获取 该 读 写 锁 。 


my rwlock/pthread rwlock tryrdlock.c 


1 #include "unpipc.h" 
2 #include "pthread rwlock.h" 
3 int 


4 pthread rwlock tryrdlock(pthread rwlock t *rw) 


5 { 


6 int result; 

Z if (rw->rw_magic != RW_MAGIC) 

8 return (EINVAL) ; 

9 if ( (result = pthread mutex lock(&rw-»rw mutex)) != 0) 

10 return (result); 

13 if (rw-»rw refcount < 0 || rw-»rw nwaitwriters > 0) 

12 result - EBUSY; /* held by a writer or waiting writers */ 
13 else 

14 rw->rw_refcount++; /* increment count of reader locks */ 
15 pthread_mutex_unlock (&rw->rw_mutex) ; 

16 return (result); 

17 } 


my_rwlock/pthread_rwlock_tryrdlock.c 


图 8-5 pthread rwlock tryrdlockÉRZ&: 试图 获取 一 个 读 出 锁 


8.4.6 pthread_rwlock_wrlock HSL 
Als-628 Hi T 4&4] Jpthread rwlock wrlockÉN2ZA ° 


my rwlock/pthread rwlock wrlock.c 


1 #include "unpipc.h" 

2 #include "pthread rwlock.h" 

3 int 

4 pthread rwlock wrlock(pthread rwlock t *rw) 
5 { 

6 int result; 

7 if (rw-»rw magic !- RW MAGIC) 

8 return (EINVAL) ; 

9 if ( (result = pthread mutex lock(&rw-»rw mutex)) !- 0) 
10 return (result); 

11 while (rw-»rw refcount != 0) { 

12 rw->rw_nwaitwriters++; 

13 result = pthread_cond_wait (&rw->rw_condwriters, &rw->rw_mutex) ; 
14 rw-»rw nwaitwriters--; 

15 if (result != 0) 

16 break; 

17 } 

18 if (result == 0) 

19 rw->rw_refcount = -1; 
20 pthread_mutex_unlock (&rw->rw_mutex) ; 
21 return (result) ; 
22 } 


my_rwlock/pthread_rwlock_wrlock.c 


图 8-6 pthread. rwlock wrlockÉRZ&: 获取 一 个 写 入 锁 

11-17 只 要 有 读 出 者 持 有 由 调用 者 指定 的 读 写 锁 的 读 出 锁 ， 或 者 
有 一 个 写 入 者 持 有 该 读 写 锁 的 唯一 写 入 锁 (两 者 都 是 rw_refcount 不 为 0 
的 情况 ) ， 调 用 线程 就 得 阻塞 。 为 此 ， 我 们 把 rw_nwaitwriters 加 1， 然 
后 在 rw_condwriters 条 件 变量 上 调用 pthread_cond_wait。 我 们 将 看 到 , 
问 该 条 件 变 量 发 送信 号 的 前 提 是 : 它 所 在 的 读 写 锁 被 释放 ， 并 且 有 写 
入 者 正在 等 待 。 

187-19 取得 写 入 锁 后 把 rw_refcount 置 为 -1。 

8.4.7 pthread, rwlock trywrlockER2it 

&j8-725 E f 3EBH SEU BJ pthread_rwlock_trywrlock iK Zi ° 117-14 
如 宁 rw_refcount 不 为 0， 那 么 由 调用 者 指定 的 读 写 锁 或 者 由 一 个 写 入 者 
持 有 ， 或 者 由 一 个 或 多 个 读 出 者 持 有 (至 于 由 哪个 挂 有 则 无 关 紧 
zi) ， 因 而 返回 一 个 EBUSY 错 误 。 否 则 ， 获 取 该 读 写 锁 的 写 入 锁 ， 并 
把 rw_refcount 置 为 -1。 


my rwlock/pthread rwlock trywrlock.c 


1 #include "unpipc.h" 

2 #include "pthread rwlock.h" 

3 int 

4 pthread rwlock trywrlock(pthread rwlock t *rw) 

5 { 

6 int result; 

7 if (rw-»rw magic !- RW MAGIC) 

8 return (EINVAL) ; 

9 if ( (result = pthread mutex lock(&rw-»rw mutex)) != 0) 

10 return(result); 

11 if (rw-»rw refcount !- 0) 

12 result - EBUSY; /* held by either writer or reader(s) */ 
13 else 

14 rw-»rw refcount - -1; /* available, indicate a writer has it */ 
15 pthread mutex unlock(&rw-»rw mutex); 

16 return(result); 

17 ) 


my rwlock/pthread rwlock trywrlock.c 


图 8-7 pthread rwlock trywrlockER Zi: 试图 获取 一 个 写 入 锁 


8.4.8 pthread rwlock unlockEN2At 


图 8-8 给 出 了 我 们 的 最 后 一 个 函数 pthread_rwlock_unlock。 

117-16 如 果 rw_refcount 当 前 大 于 0， 那 么 有 一 个 读 出 者 ( 即 调用 线 
TR) 准备 释放 一 个 读 出 锁 。 

如 果 rw_refcount 当 前 为 -1， 那 么 有 一 个 写 入 者 〈《 即 调用 线程 ) È 
MER TIAM ° 17722 WRA-T SABES, MA HHA 
用 者 指定 的 读 写 锁 变 得 可 用 〈 也 就 是 说 它 的 引用 计数 变 为 0) . SL 
rw_condwriters 条 件 变量 发 送信 号 。 我 们 知道 只 有 一 个 写 入 者 能 够 获取 
该 读 写 锁 ， 因 此 调用 pthread_cond_signal 来 唤醒 一 个 线程 。 如 没有 写 入 
者 在 等 待 ， 但 是 有 一 个 或 多 个 读 出 者 在 等 待 ， 那 融 在 rw_condreaders 条 
件 变量 上 调用 pthread_cond_broadcast， 因 为 所 有 等 待 着 的 读 出 者 都 可 
以 获取 一 个 读 出 锁 。 注 意 ， 一 旦 有 一 个 写 入 者 在 等 等 ， 我 们 就 不 给 任 
何 读 出 者 授予 读 出 锁 ， 否 则 一 个 持续 的 读 请 求法 可 能 永远 阻塞 某 个 等 
待 着 的 写 入 者 。 由 于 这 个 原因 ， 我 们 需要 两 个 分 开 的 if 条 件 测试 ， 而 不 
能 写成 : 


/* give preference to waiting writers over waiting readers */ 


if (rw->rw_nwaitwriters > 0 && rw->rw_refcount == 0){ 
result = pthread_cond_signal(&rw->rw_condwriters); 
} else if (rw-^rw. nwaitreaders > 0) 


result = pthread cond broadcast(&rw-^rw. condreaders); 


my rwlock/pthread rwlock unlock.c 


1 #include "unpipc.h" 

2 #include "pthread rwlock.h" 

B g 

4 pthread rwlock unlock(pthread rwlock t *rw) 

5 { 

6 int result; 

7 if (rw-»rw magic !- RW MAGIC) 

8 return (EINVAL) ; 

9 if ( (result = pthread mutex lock(&rw-»rw mutex)) !- 0) 
10 return(result); 

11 if (rw-»rw refcount » 0) 

12 rw-»rw refcount--; /* releasing a reader */ 
13 else if (rw-»rw refcount -- -1) 

14 rw-»rw refcount - 0; /* releasing a writer */ 
15 else 

16 err dump("rw refcount = $d", rw-»rw refcount); 

17 /* give preference to waiting writers over waiting readers */ 
18 if (rw-»rw nwaitwriters > 0) 

19 if (rw-»rw refcount -- 0) 

20 result = pthread cond signal(&rw-»rw condwriters); 
21 ) else if (rw-»rw nwaitreaders » 0) 

22 result = pthread cond broadcast (&rw-»rw condreaders); 
23 pthread mutex unlock(&rw-»rw mutex); 

24 return (result); 

25 ) 


my rwlock/pthread rwlock unlock.c 


图 8-8 pthread rwlock unlockER2: 释放 一 个 读 出 锁 或 写 入 锁 


我 们 也 可 以 省 略 对 rw->rw_refcount 的 测试 ， 不 过 那 会 导致 在 仍 分 配 


着 访 出 锁 的 情况 下 还 调用 pthread_cond_signal， 从 而 降低 了 效率 。 


8.5 线程 取消 


我 们 在 随 图 8-4 的 说 明 中 暗示 了 一 个 问题 ， 即 如 果 


pthread_rwlock_rdlock 的 调用 线程 阻 窄 在 其 中 的 pthread_cond_wait 调 用 
上 并 随后 被 取 消 ， 它 就 在 仍 持 有 互 不 锁 的 情况 下 终止 。 通 过 由 对 方 调 
用 六 数 pthread_cancel， 一 个 线程 可 以 被 同一 进程 内 的 任何 其 他 线程 所 
取消 (cancel) ，pthread_cancel 的 唯一 参数 就 是 竺 取消 线程 的 线程 ID © 


#include <pthread.h> 


int pthread_cancel(pthread_t tid); 


返回 : 春 成 功 则 为 0， 大 出 错 则 为 正 的 Exxx 值 


举例 来 说 ， 如 果 局 动 了 多 个 线程 以 执行 某 个 给 定 任务 (譬如 说 在 
某 个 数据 库 中 查找 一 个 记录 ) ， 那 么 首先 完成 任务 的 线程 可 使 用 线程 
取消 功能 取消 其 他 线程 。 为 一 个 例子 是 ， 当 多 个 线程 开始 执行 同一 个 
任务 时 ， 如 果 其 中 某 个 线程 发 现 一 个 错误 ， 它 和 其 他 线程 束 有 必要 终 
IE 

为 处 理 被 取消 的 可 能 情况 ， 任 何 线程 可 以 安装 ( 压 入 ) 和 删除 

(弹出 ) 清理 处 理 程序 。 

#include <pthread.h> 

void pthread_cleanup_push(void (*function)(void *),void *arg); 

void pthread_cleanup_pop(int execute); 

这 些 处 理 程 序 束 是 发 生 以 下 情况 时 被 调用 的 函数 : 

调用 线程 被 取消 (由 某 个 线程 调用 pthread_cancel 完 成 ) ; 

调用 线程 自愿 终止 (或 者 通过 调用 pthread_exit， 或 者 从 自己 的 线 
程 起 始 范 数 返 回 ) 。 

清理 处 理 程 序 可 以 恢复 任何 需要 恢复 的 状态 ， 例 如 给 调用 线程 当 
前 持 有 的 任何 互 斥 锁 或 信号 量 解锁 。 

pthread_cleanup_push 的 function 参 数 是 调用 线程 被 取消 时 所 调用 的 
函数 的 地 址 ，arg 是 它 的 单个 参数 。pthread_cleanup_pop 总 是 删除 调用 线 
程 的 取消 清理 栈 中 位 于 栈 顶 的 钞 数 ， 而 且 如 果 execute 不 为 0， 那 就 调用 
该 函数 。 

我 们 将 随 图 15-31 再 次 遇 到 线程 取消 ， 那 时 我 们 将 看 到 ， 在 某 个 过 
程 调 用 正在 处 理 期 间 如 果 客 户 终 止 , [服务 絮 束 被 取消 。 

例子 

说 明 上 一 地 中 我 们 的 实现 所 存在 问题 的 最 简易 方法 是 给 出 例子 。 
图 8-9 给 出 了 测试 程序 的 时 间 线 图 ， 图 8-10 给 出 了 程序 本 吴 。 


时 间 


主线 程 线程 1 线程 2 
pthread create 一 一 一 一 一 > 取得 读 出 锁 
sleep(1) sleep(3) 
pthread croata = Tu me a SIE ee -> 试图 取得 写 入 锁 
pthread join 
i 
得 ] Me 
mg a p 
FE 程 JE M 
2 D 
Were ee a Re CDM ES REUS que ne een n pt RA E. 
a iio 
返回 pthread cancel 一 一 一 一 一 -车 ”被 取消 
pthread join sleep (3) 
1 
BH | ^ 持 
3 = 有 
P 锁 
: 释放 锁 
返回 @#-------- return 
exit 


图 8-9 图 8-10 中 程序 的 时 间 线 图 
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my rwlock cancel/testcancel.c 
#include "unpipc.h" 
#include "pthread_rwlock.h" 


pthread_rwlock_t rwlock = PTHREAD RWLOCK INITIALIZER; 
pthread t tidl, tid2; 
void *threadl (void *), *thread2 (void *); 


int 
main(int argc, char **argv) 
void *status; 


Set_concurrency (2) ; 

Pthread create (&tidl, NULL, threadl, NULL); 

sleep (1) ; /* let thread1() get the lock */ 
Pthread create(&tid2, NULL, thread2, NULL); 


Pthread join(tid2, &status); 
if (status !- PTHREAD CANCELED) 
printf("thread2 status = %p\n", status); 
Pthread join(tidl, &status) ; 
if (status != NULL) 
printf ("thread1l status = %p\n", status); 


printf ("rw refcount = $d, rw nwaitreaders = $d, rw nwaitwriters = %d\n", 
rwlock.rw_refcount, rwlock.rw_nwaitreaders, 
rwlock.rw_nwaitwriters) ; 

Pthread_rwlock destroy (&rwlock) ; 


exit (0) ; 
} 
void * 
thread1 (void *arg) 
{ 
Pthread rwlock rdlock(&rwlock); 
printf("threadl() got a read lock\n") ; 
sleep(3); /* let thread2 block in pthread rwlock wrlock() */ 
pthread cancel (tid2) ; 
sleep(3); 
Pthread rwlock unlock (&rwlock) ; 
return (NULL); 
} 
void * 
thread2 (void *arg) 
{ 
printf ("thread2() trying to obtain a write lock\n"); 
Pthread_rwlock_wrlock (&rwlock) ; 
printf ("thread2() got a write lock\n"); /* should not get here */ 
sleep (1); 
Pthread rwlock unlock (&rwlock) ; 
return (NULL); 
} 


my_rwlock_cancel/testcancel.c 


18-10 展示 线程 取消 的 测试 程序 


创建 两 个 线程 


10~13 创建 两 个 进程 ， 第 一 个 线程 执行 钞 数 threadl， 第 二 个 线程 
执行 函数 thread2。 创 建 第 一 个 线程 后 睡眠 1 秒 ， 以 允许 它 获取 一 个 读 出 
[DE 

等 待 线程 终止 

14 - 23 首先 等 每 第 二 个 线程 ， 并 验证 其 状态 为 
PTHREAD CANCEL 。 接 着 待 等 第 一 个 线程 ， 并 验证 其 状态 为 一 个 空 
指针 。 然 后 输出 pthread_rwlock_t 类 型 读 写 锁 结 构 中 两 个 计数 妮 成 员 的 
fh, BUR TERIAL Ss Hl © 

thread1 HA 

26--36 第 一 个 线程 获取 一 个 读 出 锁 后 睡眠 3 秒 。 这 个 停顿 允许 另 一 
个 线程 (第 二 个 线程 ) 调用 pthread_rwlock_wrlock 并 阻塞 在 其 中 的 
pthread_cond_wait 调 用 中 ， 因 为 在 有 一 个 读 出 锁 活 跃 期 间 ， 十 无 法 提供 
写 入 锁 的 。 本 线程 然后 调用 pthread_cancel 取 消 另 一 个 线程 ， 再 睡眠 3 秒 
后 释放 所 持 有 的 读 出 锁 ， 然 后 终止 。 

thread2 WAL 

37~46 第 二 个 线程 试图 获取 一 个 写 入 锁 (这 是 不 可 能 取得 的 ， 
为 第 一 个 线程 已 经 获取 了 一 个 读 出 锁 ) 。 本 函数 的 其 余部 分 不 应 该 被 
执行 。 

如 有 果 使 用 上 一 节 中 给 出 的 画 数 运行 本 测试 程序 ， 那 么 我 们 将 得 到 
如 下 结 


solaris % testcancel 


thread1()got a read lock 
thread2()trying to obtain a write lock 


而 且 肯 定 不 返回 shell 提 示 符 状态 。 该 程序 被 挂 起 。 发 生 如 下 步 


(1) 第 二 个 线程 调用 pthread_rwlock_wrlock (图 8-6) ， 阻 塞 在 其 中 
的 pthread_cond_wait 调 用 中 。 


(2) 第 一 个 线程 中 的 sleep(3) 返 回 ，pthread_cancel 被 接着 调用 。 

(3) 第 二 个 线程 被 取消 GLB RAIL) 。 当 阻塞 在 某 个 条 件 变 
量 等 待 中 的 一 个 线程 被 取消 时 ， 要 再 次 取得 与 该 条 件 变 量 天 联 的 互 不 
锁 ， 然 后 调用 第 一 个 线程 取消 清理 处 理 程序 。 (我 们 尚未 安装 任何 线 
程 取 消 清 理 处 理 程序 ， 但 是 所 关联 的 互 不 锁 仍然 在 该 线程 被 取消 前 再 
次 取得 。) 因此 ， 当 第 二 个 线程 被 取消 时 ， 它 持 有 包含 在 读 写 锁 中 的 
互 斥 锁 ， 而 且 图 8-6 中 rw_nwaitwriters 的 值 已 被 加 ] 。 

(4) 第 一 个 线程 调用 pthread_rwlock_unlcok， 但 它 永 远 阻 塞 在 其 中 的 
pthread_mutex_lock 调 用 中 〈 图 8-8) ， 因 为 它 想 要 持 有 的 互 斥 锁 仍 然 由 
已 被 取消 的 线程 锁 着 。 

要 是 我 们 去 掉 thread1 函 数 中 的 pthread_rwlock_unlock 调 用 ， 那 么 主 
线程 将 输出 如 下 : 


rw. refcount = 1,rw nwaitreaders = 0,rw_nwaitwriters = 1 


pthread_rwlock_destroy error: Device busy 

第 一 个 计数 器 是 1， 因 为 我 们 删除 了 pthread_rwlock_unlock 调 用 ， 
但 是 最 后 一 个 计数 右 也 是 1， 因 为 它 是 由 第 二 个 线程 在 被 取消 前 加 1 了 
HTT eas ° 

xx — [mH] EL Z2] 1E X8 KR Pe Be, BA 84 H 
pthread_rwlock_rdlock K žá DON TIS 〈 前 有 加 号 指示 ) ， 它 们 把 
pthread_cond_wait 调 用 括 了 起 来 : 


rw->rw_nwaitreaders++; 


+ prhread_cleanup_push(rwlock_cancelrdwait,(void *)rw); 
+ pthread_cleanup_pop(0); 
result = pthread_cond_wait(&rw->rw_condreaders,&rw- 
>rw_mutex); 


rw->rw_nwaitreaders--; 


一 行 新 代码 建立 一 个 清理 处 理 程 序 (我 们 的 rwlock_cancelrdwait 
WA) ， 它 的 单个 参数 将 是 读 写 锁 指 针 rw。 如 果 pthread_cond_wait 返 
回 ， 第 二 行 靳 代码 就 删除 这 个 清理 处 理 程 序 。pthread_cleanup_pop 的 值 
为 0 的 单个 参数 指示 不 调用 该 处 理 程序 。 要 是 该 参数 不 为 0， 那 就 和 完 调 
用 这 个 清理 处 理 程序 再 删除 它 。 

"ii| R pthread_rwlock_rdlock 的 调用 线程 在 阻塞 于 该 函数 中 的 
pthread_cond_wait 调 用 期 间 被 取消 ， 它 束 不 会 从 该 贸 数 返 回 ， 而 是 会 调 
用 清理 处 理 程序 (在 重新 获取 所 关联 的 互 不 锁 之 后 ， 我 们 已 在 前 面 的 
第 3 步 中 提 到 过 这 一 点 ) c 

图 8-11 给 出 了 我 们 的 rwlock_cancelrdwait 函 数 ， 它 是 我 们 为 pthread 
rwlock_rdlock 建 立 的 清理 处 理 程 序 。8 一 9 fürw . nwaitreaders il 25 88 Val 
1， 并 给 互 斥 锁 解 锁 。 这 是 在 调用 pthread_cond_wait 前 建立 的 “状态 ”， 
其 调用 线程 被 取消 时 必须 恢复 到 该 状态 。 


my rwlock cancel/pthread rwlock rdlock.c 
3 static void 
4 rwlock cancelrdwait (void *arg) 


5 { 


6 pthread rwlock t *rw; 
7 rw - arg; 
8 rw-»rw nwaitreaders--; 
pthread mutex unlock(&rw-»rw mutex); 
10 } 


- my rwlock cancel/pthread rwlock rdlock.c 


图 8-11 rwlock_cancelrdwait 函 数 : 读 出 锁 的 清理 处 理 程序 


XT A] 8-6 "P? pthread_rwlock_wrlock& AGE TR MWE * BIE, TE 
pthread_cond_wait 调 用 前 后 各 增加 一 行 新 代码 : 


rw->rw_nwaitwriters++; 


+ prhread cleanup push(rwlock cancelwrwait,(void *)rw); 
十 pthread cleanup. pop(0); 
result = pthread_cond_wait(&rw->rw_condwriters,&rw- 


>rw_mutex); 


rw->rw_Nwaitwriters--; 
Al8-1228 HH T Fe] A rwlcok_cancelwrwaitK WW, CHS ABUS 
求 的 清理 处 理 程序 。 


my rwlock cancel/pthread rwlock wrlock.c 


3 static void 
4 rwlock cancelwrwait(void *arg) 
5 { 


6 pthread rwlock t *rw; 
7 rw - arg; 
8 rw-»rw nwaitwriters--; 


pthread mutex unlock(&rw-»rw mutex); 


10 } 
my rwlock cancel/pthread rwlock wrlock.c 


图 8-12 rwlock cancelwrwaitEkZN: 写 入 锁 的 清理 处 理 程序 
8~9 给 rw_nwaitwriters 计 数 句 减 1， 并 给 互 扩 锁 解 锁 。 
用 这 些 新 函数 运行 图 8-10 中 的 测试 程序 ， 结 果 是 正确 的 : 


solaris % testcancel 


thread1()got a read lock 
thread2()trying to obtain a write lock 
rw_refcount = 0,rw_nwaitreaders = 0,rw_nwaitwriters = 0 
三 个 计数 器 的 值 都 是 正确 的 ，thread1 从 它 的 pthread_rwlock_unlock 
调用 返回 ， 而 且 pthread_rwlock_destroy 不 返回 EBUSY 错 误 。 
本 节 仅 仅 是 线程 取消 的 一 个 概貌 。 它 还 有 许多 细节 ， 参 见 
| Butenhof 1997] 的 5.3 节 。 


8.6 小 结 


与 普通 的 互 不 相 比 ， 当 被 保护 数据 的 读 访 问 比 写 访问 更 为 频 烷 
时 ， 读 写 锁 能 提供 更 高 的 并 发 度 。 本 章 讲述 的 由 Unix 98 定 义 的 读 写 锁 
函数 或 类 似 函 数 应 出 现在 某 个 未 来 的 Posix 标 准 中 。 这 些 函 数 与 第 7 草 讲 
WAY EL FR DEER COS TUA, ° 


读 写 锁 可 以 只 通过 使 用 互 斥 锁 和 条 件 变 量 来 实现 ， 我 们 给 出 了 一 
个 实现 例子 。 这 个 实现 优先 考虑 等 待 着 的 写 入 者 ， 但 是 有 的 实现 优先 
考虑 等 竺 着 的 读 出 者 。 

线程 可 能 在 阻塞 于 pthread_cond_wait 调 用 期 间 被 取消 ， 我 们 的 读 写 
锁 实现 允许 看 到 这 种 情况 的 发 生 。 我 们 使 用 线程 取消 清理 处 理 程 序 解 
决 了 这 个 问题 。 


习题 


8.1 修改 8.4 志 中 我 们 的 读 写 锁 实 现 ， 优 先 考 虑 读 出 者 而 不 是 写 入 
者 。 
8.2 度量 并 比较 8.4 市 中 我 们 的 读 写 锁 实现 和 厂家 提供 的 实现 的 性 


unb 
GG 


第 9 章 记录 上 锁 
9.1 概述 


上 一 章 讲述 的 读 写 锁 是 作为 pthread_rwlock_t 数 据 类 型 的 变量 在 内 
存 中 分 配 的 。 当 读 写 锁 是 在 单个 进程 内 的 各 个 线程 间 共 享 时 〈 默 认 情 
DU) ， 这 些 变 量 可 以 在 那个 进程 内 ， 当 读 写 锁 是 在 共享 某 个 内 存 区 的 
进程 间 共 享 时 (假设 初始 化 它们 时 指定 了 
PTHREAD_PROCESS_SHARED 属 性 ) ， 这 些 变 量 应 该 在 该 共享 内 存 
区 中 。 

本 章 讲述 读 写 锁 的 一 种 扩展 类 型 ， 它 可 用 于 有 杀 缘 关系 或 无 亲缘 
关系 的 进程 之 间 共 享 某 个 文件 的 读 与 写 。 被 锁 住 的 文件 通过 其 描述 符 
访问 ， 执 行 上 锁 操 作 的 函数 是 fcntt。 这 种 类 型 的 锁 通 常 在 内 核 中 维护 ， 


其 属 主 是 由 属 主 的 进程 ID 标识 的 。 这 意味 着 这 些 锁 用 于 不 同 进程 间 的 
上 锁 ， 而 不 是 用 于 同一 进程 内 不 同 线程 间 的 上 锁 。 

我 们 将 在 本 章 介绍 序列 号 持续 加 1 的 例子 。 考 虑 来 自 Unix 打 印 假 脱 
机 处 理 系统 (BSD 下 使 用 1pr 命 令 访问 ，System V 下 使 用 lp 命令 访问 ) 
的 下 述 情 形 。 把 一 个 打印 作业 加 到 打印 队列 中 ( 供 男 一 个 进程 在 以 后 
某 个 时 候 打 印 ) 的 进程 必须 给 每 个 作业 赋 一 个 唯一 的 序列 号 。 只 是 在 
该 进程 运行 期 间 唯一 的 进程 ID 不 能 用 作 这 个 序列 号 ， 因 为 一 个 打印 作 
业 可 能 存在 很 长 时 间 ， 期 间 早先 把 它 加 到 打印 队列 中 的 进程 的 进程 ID 
可 能 被 重用 。 男 外 ， 一 个 给 定 进 程 可 以 往 某 个 队列 中 加 入 多 个 打印 作 
业 ， 而 每 个 作业 都 需要 一 个 唯一 的 作业 号 。 打 印 假 脱 机 处 理 系统 使 用 
的 技巧 是 ， 给 每 台 打 印 机 准备 一 个 文件 ， 它 是 只 有 一 个 单行 的 ASCII 文 
本 文件 ， 其 中 含有 竺 用 的 下 一 个 序列 号 。 需 要 给 某 个 打印 作业 赋 一 个 
序列 号 的 每 个 进程 都 得 经 历 以 下 三 个 步骤 。 

(1) 读 序列 号 文件 。 

(2) 使 用 其 中 的 序列 号 。 

(3) 给 序列 号 加 1 并 写 回 文件 中 。 

问题 是 当 某 个 进程 在 执行 这 三 个 步骤 时 ， 另 一 个 进程 可 能 在 执行 
同样 的 三 个 步 又。 这 将 导致 混乱 ， 如 我 们 将 在 后 面 的 一 些 例子 中 看 到 
的 那样 。 

我 们 刚刚 叙述 的 是 一 个 互 斥 问 题 。 它 可 使 用 第 7 章 讲 述 的 互 斤 锁 或 
第 8 章 讲 述 的 读 写 锁 来 解决 。 然 而 不 同 的 是 ， 我 们 假设 各 个 进程 彼此 无 
亲缘 关系 ， 从 而 让 使 用 这 些 技 巧 更 为 困难 。 我 们 可 以 让 这 些 进 程 共享 
某 个 内 存 区 (如 本 书 第 4 部 分 所 述 ) ， 然 后 在 该 共享 内 存 区 中 使 用 某 种 
类 型 的 同步 变量 ， 不 过 对 于 无 杀 缘 头 系 的 进程 ，fcnd 记 录 上 锁 往 往 更 易 
使 用 。 男 一 个 因素 是 ， 我 们 随行 式 打 印 机 假 脱 机 处 理 系统 插 述 的 问 
题 ， 在 互 厂 锁 、 条 件 变 量 和 读 写 锁 的 可 用 之 前 许多 年 殉 存 在 。 记 录 上 


锁 是 在 20 世 纪 80 年 代 早期 加 到 Unix 中 的 ， 先 于 共享 内 存 区 和 线程 的 开 
发 o 

我 们 所 需 的 是 : 一 个 进程 能 够 设置 某 个 锁 ， 以 宣称 没有 其 他 进程 
能 够 访问 相应 的 文件 ， 直 到 第 一 个 进程 完成 访问 为 止 。 图 9-2 给 出 了 执 
行 上 述 三 个 步骤 的 一 个 简单 程序 。 函 数 my_ lock 和 my_unlock 分 别 用 于 
刚 开 始 时 给 序列 号 文件 上 锁 以 及 完成 序列 号 更 新 时 给 该 文件 解锁 。 我 
们 将 给 出 这 两 个 函数 的 多 种 实现 。 

20 每 次 循环 输出 序列 号 时 同时 输出 正在 运行 的 程序 的 名 字 

(argv[0]) ， 因 为 这 个 main 范 数 与 不 同 版 本 的 上 锁 画 数 一 块 使 用 ， 而 

我 们 希望 看 到 哪个 版 本 在 输出 序列 号 。 

输出 进程 ID 需要 把 类 型 为 pid_t 的 变量 强制 转换 成 long 类 型 ， 然 后 
使 用 %1d 格 式 化 串 输出 。 其 原因 是 ， 尽 管 pid_t 是 一 个 整数 类 型 ， 但 我 们 
不 知道 它 的 大 小 (int 或 long) ， 因 此 必须 假设 成 最 大 的 类 型 。 要 是 我 们 
假设 它 是 int 类 型 并 使 用 %d 格 式 化 串 ， 但 是 实际 类 型 却 为 Iong， 那 么 代 
码 是 错误 的 。 

为 展示 不 上 锁 的 后 果 ， 图 9-1 提 供 了 根本 不 上 锁 的 两 个 “< 上 锁 * 函 
ZW o 


lock/locknone.c 
1 void 
2 my lock(int fd) 
31 
4 return; 
5 } 
6 void 
7 my unlock(int fd) 
8 
9 return; 
10 ) 
lock/locknone.c 


图 9-1 不 上 锁 的 函数 


如 采 序 列 号 文件 中 的 序列 号 初始 化 为 1， 而 且 该 程序 只 有 一 个 副本 
在 运行 ， 那么 结 末 如 下 : 


solaris 96 locknone 


locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 


locknone: 


pid = 15491,seq# = 1 
pid = 15491,seq# = 2 
pid = 15491,seq# = 3 
pid = 15491,seq# = 4 
pid = 15491,seq# = 5 
pid = 15491,seq# = 6 
pid = 15491,seq# = 7 
pid = 15491,seq? = 8 
pid = 15491,seq# = 9 
pid = 15491,seq# = 10 
pid = 15491,seq# = 11 
pid = 15491,seq? = 12 
pid = 15491,seq# = 13 
pid = 15491,seq# = 14 
pid = 15491,seq? = 15 
pid = 15491,seq# = 16 
pid = 15491,seq# = 17 
pid = 15491,seq# = 18 
pid = 15491,seq# = 19 
pid = 15491,seq# = 20 


注意 main 函 数 (图 9-2) 是 在 一 个 名 为 lockmain.c 的 文件 中 ， 但 是 当 
BNE SAUTER EB ee (图 9-1) 一 同 编译 和 链接 时 ， 称 
结果 的 可 执行 文件 为 locknone。 这 是 因为 我 们 将 提供 my_lock 和 
my_unlock 这 两 个 函数 的 其 他 实现 ， 它 们 使 用 不 同 鸭 上 锁 技 巧 ， 因 此 我 
们 根据 所 用 的 上 锁 类 型 命名 可 执行 文件 。 


lock/lockmain.c 


1 #include "unpipc.h" 

2 #define SEQFILE "segno" /* filename */ 

3 void my lock(int), my unlock(int); 

4 int 

5 main(int argc, char **argv) 

6 { 

7 int fd; 

8 long i, seqno; 

9 pid t pid; 

10 ssize t n; 

11 char line[MAXLINE + 1]; 

12 pid = getpid(); 

13 fd = Open(SEQFILE, O_RDWR, FILE MODE); 

14 for (i = 0; i < 20; i++) { 

15 my lock (fd) ; /* lock the file */ 

16 Lseek(fd, OL, SEEK_SET); /* rewind before read */ 

17 n - Read(fd, line, MAXLINE); 

18 line[n] = '\0'; /* null terminate for sscanf */ 
19 n = sscanf(line, "%ld\n", &seqno) ; 

20 printf ("%s: pid = $1d, seq# = %ld\n", argv[0], (long) pid, seqno) ; 
gm seqno++; /* increment sequence number */ 
22 snprintf (line, sizeof (line), "%ld\n", seqno) ; 

23 Lseek (fd, OL, SEEK SET); /* rewind before write */ 
24 Write(fd, line, strlen(line)); 

25 my unlock(fd); /* unlock the file */ 

26 ) 

23 exit (0); 

28 } 


lock/lockmain.c 


图 9-2 3t P E SUBIT main EC 
把 序列 号 重新 初始 化 为 1， 然 后 在 后 台 运 行 该 程序 两 次 ， 其 结果 如 


solaris % locknone & locknone & 

solaris % locknone: pid = 15498,seq# = 1 
locknone: pid = 15498,seq# = 2 
locknone: pid = 15498,seq# = 3 
locknone: pid = 15498,seq# = 4 
locknone: pid = 15498,seq# = 5 
locknone: pid = 15498, seq# = 6 


locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
出 错 locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 
locknone: 


locknone: 


pid = 15498,seq# = 7 
pid = 15498,seq# = 8 
pid = 15498,seq# = 9 
pid = 15498,seq# = 10 
pid = 15498,seq# = 11 
pid = 15498,seq# = 12 
pid = 15498,seq# = 13 
pid = 15498,seq# = 14 
pid = 15498,seq# = 15 
pid = 15498,seq# = 16 
pid = 15498,seq# = 17 
pid = 15498,seq# = 18 
pid = 15498,seq# = 19 
pid = 15498,seq# = 20 
pid = 15499,seq# = 1 
pid = 15499, seq# = 2 
pid = 15499, seq# = 3 
pid = 15499,seq# = 4 
pid = 15499,seq# = 5 
pid = 15499, seq# = 6 
pid = 15499, seq# = 7 
pid = 15499, seq# = 8 
pid = 15499,seq# = 9 
pid = 15499,seq# = 10 
pid = 15499,seq# = 11 
pid = 15499,seq# = 12 
pid = 15499, seq# = 13 


SIT LLY E E 


内 核 切换 进程 后 开始 


locknone: pid = 15499,seq# = 14 

locknone: pid = 15499,seq# = 15 

locknone: pid = 15499,seq# = 16 

locknone: pid = 15499,seq# = 17 

locknone: pid = 15499,seq# = 18 

locknone: pid = 15499,seq# = 19 

locknone: pid = 15499,seq# = 20 

我 们 首先 注意 到 shell 提 示 符 在 程序 输出 第 一 行 之 前 输出 。 这 是 正 
常 的 ， 而 且 在 后 台 运 行程 序 时 经 常见 到 。 

前 20 行 输出 是 正常 的 ， 它 们 由 该 程序 的 第 一 个 实例 (进程 四 为 
15498) 输出 。 但 是 该 程序 另 一 个 实例 (进程 有 D 为 15499) 的 第 一 行 输 
出 中 却 出 现 了 问题 ， 它 输出 一 个 值 为 1 的 序列 号 ， 表 明 它 也 许 是 由 内 核 
第 一 个 启动 ， 当 它 读 完 序 列 号 文件 (序列 号 值 为 1) 后 ， 内 核 切换 另 一 
个 进程 来 运行 。 该 进程 直到 另 一 个 进程 终止 时 才 再 次 运行 ， 它 继续 执 
行 所 用 的 值 是 在 内 核 切换 进程 前 已 读 出 的 值 1。 这 不 是 我 们 所 希望 的 。 
每 个 进程 读 出 、 加 1 然后 写 入 序列 号 文件 20 次 (从 而 恰好 有 40 行 输 
出 ) ， 因 此 序列 号 的 最 终 值 应 该 是 40。 

我 们 需要 某 种 方法 以 允许 一 个 进程 在 执行 前 述 三 个 步骤 期 间 防 止 
其 他 进程 访问 序列 号 文件 。 这 就 是 说 ， 考 虑 到 其 他 进程 ， 这 三 个 步骤 
应 作为 一 个 原子 操作 (atomic operation) 来 执行 。 看 这 个 问题 的 另 一 种 
方式 是 ， 图 9-2 中 调用 my_lock 和 调用 my_unlock 之 间 的 几 行 代码 构成 一 
个 临界 区 (critical region) ， 如 第 7 章 中 所 述 。 

像 刚 才 所 示 的 那样 在 后 台 运 行 图 9-2 中 程序 的 两 个 实例 时 ， 其 输出 
是 非 确定 的 (nondeterministic) 。 每 次 运行 该 程序 的 两 个 实例 时 ， 不 能 
保证 得 到 同样 的 结 采 。 如 采 早 移 所 列 的 三 个 步骤 因 考 虑 到 其 他 进程 而 
原子 地 处 理 ， 从 而 产生 40 这 个 最 终 值 ， 那 么 结 采 的 不 确定 性 不 表示 有 
错 。 但 是 如 果 这 三 个 步骤 不 是 原子 地 处 理 ， 往 往 会 产生 一 个 小 于 40 的 


最 终 值 ， 那 就 不 正确 了 。 举例 来 说 ， 我 们 并 不 关心 是 第 一 个 进程 先 把 
序列 号 从 1 递增 到 20， 第 二 个 进程 接着 从 21 递 增 到 40， 还 是 每 个 进程 都 
运行 刚好 足够 长 时 间 ， 从 而 每 次 运行 把 序列 号 递增 2 (第 一 个 进程 输出 
1 和 2， 然 后 第 二 个 进程 输出 3 和 4， 如 此 等 等 ) 。 

非 确 定性 并 没有 造成 不 正确 。 造 成 程序 运行 正确 与 否 的 是 前 述 三 
个 步骤 是 否 原 子 地 执行 。 然 而 非 确 定性 往往 使 这 些 类 型 程序 的 调试 更 
为 困难 。 


9.2 对 比 记录 上 锁 与 文件 上 锁 


Unix 内 核 没 有 文件 内 的 记录 这 一 概念 。 任 何 关 于 记录 的 解释 都 是 
由 读 写 文件 的 应 用 来 进行 的 。 然 而 Unix 内 核 提 供 的 上 锁 特性 却 用 记录 
上 锁 (record locking) 这 一 术语 来 描述 。 不 过 应 用 会 指定 文件 中 待 上 锁 
或 解锁 部 分 的 字 节 范围 (byte range) 。 这 个 字 节 范围 是 否 跟 同一 文件 
内 的 一 个 或 多 个 逻辑 记录 有 关联 是 应 用 的 事 。 

Posix 记 录 上 锁定 义 了 一 个 特殊 的 字 市 范围 以 指定 整个 文件 ， 它 的 
起 始 偏 移 为 0 (文件 的 开头 ) ， 长 度 也 为 0。 本 章 的 讨论 集中 于 记录 上 
锁 ， 文 件 上 锁 只 是 它 的 一 个 特例 。 

术语 粒度 (granularity) 用 于 标记 能 被 锁 住 的 对 象 的 大 小 。 对 于 
Posix 记 录 上 锁 来 说 ， 粒 度 就 是 单个 字 节 。 通 常情 况 下 粒度 越 小 ， 人 允许 
同时 使 用 的 用 户 数 就 越 多 。 举 例 来 说 ， 假 设 有 五 个 进程 几乎 同时 访问 
一 个 给 定 的 文件 ， 其 中 三 个 是 读 出 者 ， 两 个 是 写 入 者 。 再 假设 所 有 五 
个 进程 准备 访问 该 文件 中 的 不 同 记录 ， 而 且 这 五 个 请 求 中 的 每 一 个 需 
花 的 时 间 几 乎 相同 ， 壁 如 说 1 秒 。 如 果 上 锁 是 在 文件 级 别 (可 能 的 最 粗 
粒度 ) 上 进行 的 ， 那么 所 有 三 个 读 出 者 可 以 同时 访问 它们 各 自 的 记 
孙 ， 但 是 那 两 个 写 入 者 必须 等 到 所 有 读 出 者 完成 访问 为 止 。 然 后 其 中 
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的 时 间 将 大 约 是 3 秒 。 (当然 我 们 在 这 些 定时 假设 中 名 上 略 了 许多 细 
Po) 但 是 如 果 上 锁 粒 度 是 记录 (可 能 的 最 细 粒 度 ) ， 那 么 所 有 五 个 
进程 都 能 同时 处 理 ， 因 为 它们 各 目 访问 的 是 不 同 的 记录 。 于 是 总 的 时 
间 只 有 1 秒 。 

源 目 Berkeley 的 Unix 实 现 文 持 给 整个 文件 上 锁 或 解锁 的 文件 上 锁 

(file locking) ， 但 没有 给 文件 内 的 字 节 范围 上 锁 或 解锁 的 能 力 。 文 件 
ESL flock Zi e DE o 

历史 

多 年 来 Unix 下 的 文件 和 记录 上 锁 已 应 用 了 各 种 各 样 的 技巧 。 诸 如 
UUCP 守 护 进程 和 行 式 打印 机 守护 进程 之 类 的 早期 程序 所 使 用 的 各 种 技 
巧 充 分 利用 了 文件 系统 实现 上 的 特色 。 (我 们 将 在 9.8 方 讨论 其 中 三 个 
文件 系统 技巧 。) 然而 这 些 技巧 使 用 起 来 速度 比较 慢 ， 因 此 20 世 纪 80 
年 代 早 期 实现 的 数据 库 系 统 提出 了 使 用 更 好 技巧 的 要 求 。 

第 一 个 真正 的 文件 和 记录 上 锁 是 由 John Bass 于 1980 年 加 到 Version 7 
中 的 ， 新 增 的 一 个 系统 调用 名 为 locking。 它 提供 强制 性 记录 上 锁 ， 并 
为 System II 和 Xenix 的 许多 版 本 所 治 用 。 (我 们 将 在 本 章 以 后 说 明 强 制 
性 上 锁 和 劝告 性 上 锁 的 区 别 ， 以 及 记录 上 锁 和 文件 上 锁 的 区 别 。) 

4.2BSD 于 1983 年 通过 flock 函数 提供 了 文件 上 锁 (不 是 记录 上 
锁 ) 。1984 年 的 /usr/group 标 准 (X/Open 的 前 身 之 一 ) X T lockf ER 
数 ， 它 只 提供 独占 锁 NSARM) ， 而 没有 提供 共享 锁 ( 即 读 出 
锁 ) 。 

System V Release 2 (SVR2) 于 1984 年 通过 fcntl 函 数 提供 了 劝告 性 
WKE ° lock KAE ERT, BEER E&A gH feoti EKR, 
不 是 系统 调用 。 (许多 当前 的 系统 仍然 提供 使 用 fentl 完 成 的 lockf 实 
Hl») System V Release3 (SVR3) 于 1986 年 给 fcnd 增 加 了 强制 性 记录 
上 锁 能 力 ， 它 使 用 了 文件 的 SGID 权 限 位 ， 我 们 将 在 9.5 节 中 讨论 。 


1988 年 的 Posix.1 标 准 对 fcnd 函 数 的 劝告 性 文件 和 记录 上 锁 功 能 进行 

了 标准 化 ， 这 就 是 本 章 要 讲述 的 内 容 。X/Open 可 移植 性 指南 第 3 期 

(X/Open Portability Guide Issue 3， 和 人 简称 XPG3，1988 年 ) 也 指出 记录 
ES OB fent ER LP DE ° 


9.3 Posix fcntl 记 录 上 锁 


记录 上 锁 的 Posix 接 口 是 fcntl 函 数 。 
#include <fcntl.h> 
in.fcntl(in.fd,in.cmd,.. /.struc.floc.*ar.*.); 
返回 : 者 成 功 则 取决 于 cmd， 才 出错 则 为 -1 
用 于 记录 上 锁 的 cmd 参 数 共 有 三 个 值 。 这 三 个 命令 要 求 第 三 个 参数 
arg 是 指 问 某 个 flock 结 构 的 指针 : 
struct flock { 
shortl type; /* F RDLCK,F WRLCK,F UNLCK */ 
short | whence; /* SEEK, SET,SEEK, CUR,SEEK END */ 
off t1 start; /* relative starting offset in bytes */ 
off tl len: /* £bytes; 0 means until end-of-file */ 
pid tl pid; /* PID returned by F GETLK */ 
H 
pi upon ps 
F SETLK 获取 (1 type; 51 7jF RDLCKz&kF. WRLCK) 或 释放 
(]_type 成 员 为 F_UNLCK) 由 arg 指 向 的 flock 结 构 所 描述 的 锁 。 
如 果 无 法 将 该 锁 授 予 调用 进程 ， 该 贸 数 就 立即 返回 一 个 EACCES 或 
EAGAIN 错 误 而 不 阻塞 。 
F SETLKW 该 命令 与 上 一 个 命令 类 似 ， 不 过 如 果 无 法 将 所 请 求 的 
锁 授予 调用 进程 ， 调 用 线程 将 阻塞 到 该 锁 能 够 授予 为 止 。 (该 命令 的 


名 字 中 最 后 一 个 字母 W 意 思 是 “等 待 (wai) ”。) [1] 

F GETLK 检查 由 arg 指 回 的 锁 以 确定 是 否 有 某 个 已 存在 的 锁 会 妨碍 
将 新 锁 授 予 调用 进程 。 如 有 果 当 前 没有 这 样 的 锁 存 在 ， 由 arg 指 向 的 flock 
结构 的 ]_type 成 员 就 被 置 为 FE_UNLCK 。 否 则 ， 关 于 这 个 已 存在 锁 的 信 
息 将 在 由 arg 指 向 的 flock 结 构 中 返回 〈 也 就 是 说 ， 该 结构 的 内 容 由 fcntl 
RAVES) ， 其 中 包括 持 有 该 锁 的 进程 的 进程 ID。 [2] 

应 清楚 发 出 F_GETLK 命 令 后 紧 接着 发 出 F_SETLK 命 令 不 是 一 个 原 
子 操作 。 这 就 是 说 ， 如 果 我 们 发 出 F_GETLK 命 令 ， 并 且 执 行 该 命令 的 
fcntl Ek Zt 3& [8] | E l type 成 员 为 F_UNLCK， 那 么 跟着 立即 发 出 
F_SETLK 命 令 不 能 保证 其 fcnt 函 数 会 成 功 返 回 。 这 两 次 调用 之 间 可 能 
有 另外 一 个 进程 运行 并 获取 了 我 们 想 要 的 锁 。 

提供 FE_GETLK 命 令 的 原因 在 于 : APARTE SETLK A S Bfcntl ER ZA 
返回 一 个 错误 时 ， 导 致 该 错误 的 某 个 锁 的 信息 可 由 FE_GETLK 命 令 返 
回 ， 从 而 允许 我 们 确定 是 哪个 进程 锁 住 了 所 请 求 的 文件 区 ， 以 及 上 锁 
方式 ( 读 出 锁 或 写 入 锁 ) 。 但 是 即使 是 这 样 的 情形 ，F_GETLK 命 令 也 
可 能 返回 该 文件 区 已 解锁 的 信息 ， 因 为 在 F_SETLK 和 F_GETLK 命 令 之 
间 ， 该 文件 区 可 能 被 解锁 。 

flock 结 构 描 述 锁 的 类 型 ( 读 出 锁 或 写 入 锁 ) 以 及 待 锁 住 的 字 市 范 
。 跟 lseek 一 样 ， 起 始 字 节 偏 移 是 作为 一 个 相对 偏 移 (1_start 成 员 ) 伴 
随 其 解释 (1_whence 成 员 ) 指定 的 。1_whence 成 员 有 以 下 三 个 取 值 。 

SEEK SET: 1_start 相 对 于 文件 的 开头 解释 。 

SEEK CUR: 1_start 相 对 于 文件 的 当前 字 节 偏 移 〈 即 当前 读 写 指针 
位 置 ) 解释 。 

SEEK END: 1_start 相 对 于 文件 的 末尾 解释 。 

1_len 成 员 指定 从 该 偏 移 开 始 的 连续 字 节 数 。 长 度 为 0 意思 是 “从 起 
人 偏 移 到 文件 偏 移 的 最 大 可 能 值 "。 因 此 ， 锁 住 整个 文件 有 两 种 方式 。 


(D185El whence 成 员 为 SEEK_SET，1_start 成 员 为 0，l_len 成 员 为 


(2) 使 用 lseek 把 读 写 指针 定位 到 文件 头 ， 然 后 指定 1L_whence 成 员 为 
SEEK_CUR，1_start 成 员 为 0，1_len 成 员 为 0。 

第 一 种 方式 最 常用 ， 因 为 它 只 需 一 个 函数 调用 (fent) 而 不 是 两 个 
( 另 见习 题 9.10) 

fcntl 记 录 上 锁 既 可 用 于 读 也 可 用 于 写 ， 对 于 一 个 文件 的 任意 字 节 ， 
最 多 只 能 存在 一 种 类 型 的 锁 〈 读 出 锁 或 写 入 锁 ) 。 而 且 ， 一 个 给 定 字 
节 可 以 有 多 个 读 出 锁 ， 但 只 能 有 一 个 写 入 锁 。 这 跟 我 们 在 上 一 章 讲 壕 
的 读 写 锁 是 一 致 的 。 上 自然 ， 当 一 个 描述 符 不 是 打开 来 用 于 读 时 ， 如 果 
我 们 对 它 请 求 一 个 读 出 锁 ， 错 误 就 会 发 生 ， 同 样 ， 当 一 个 描述 符 不 是 
打开 来 用 于 写 时 ， 如 果 我 们 对 它 请 求 一 个 写 入 锁 ， 错 误 也 会 发 生 。 

对 于 一 个 打开 着 某 个 文件 的 给 定 进程 来 说 ， 当 它 关 闭 该 文件 的 所 
有 描述 符 或 它 本 身 终止 时 ， 与 该 文件 关联 的 所 有 锁 都 被 删除 。 [3] 锁 不 
能 通过 fork 由 子 进程 继承 。 

在 进程 终止 时 由 内 核 完 成 已 有 锁 清理 工作 的 特性 只 有 fcntl 记 录 上 锁 
完全 提供 了 ， System V 信 号 量 则 把 它 作 为 一 个 选项 提供 。 我 们 讲述 的 
其 他 同步 技巧 〈 互 斥 锁 、 条 件 变 量 、 读 写 锁 、Posix 信 号 量 ) 并 不 在 进 
程 终 止 时 执行 清理 工作 。 我 们 已 在 7.7 节 末尾 讨论 过 这 一 点 。 

记录 上 锁 不 应 该 同 标准 IO 函数 库 一 块 使 用 ， 因 为 该 函数 库 会 执行 
内 部 缓冲 。 当 某 个 文件 需 上 锁 时 ， 为 避免 问 题 ， 应 对 它 使 用 read 和 
write ° 

9.3.1 例子 

现在 回 到 网 9-2 中 的 例子 ， 并 把 图 9-1 中 的 两 个 函数 my lock 和 
my_unlock 重 新 编写 成 使 用 Posix 记 录 上 锁 。 图 9-3 给 出 了 这 些 函 数 。 

注意 ， 我 们 必须 指定 写 入 锁 ， 以 保证 任何 时 刻 只 有 一 个 进程 更 新 
序列 号 〈 见 习题 9.4) 。 在 获取 该 锁 时 所 指定 的 命令 为 F_SETLKW， 因 


为 如 采 该 锁 不 可 得 ， 那 么 我 们 和 希望 阻塞 到 它 变 为 可 得 为 止 。 

有 了 早先 给 出 的 flock 结 构 的 定义 后 ， 有 人 可 能 认为 在 my_lock 中 可 
以 如 下 初始 化 我 们 的 结构 : 

static struct flock lock = ( F WRLCK,SEEK SET,0,0,0 }; 

然而 这 是 错误 的 。Posix 只 定义 在 一 个 结构 (例如 flock) 中 的 必需 
成 员 。 各 个 实现 可 以 以 任意 顺序 排列 这 些 成 员 ， 还 可 以 增设 特定 于 实 
现 的 成 员 。 


lock/lockfentl.c 


1 include "unpipc.h" 


2 void 
3 my lock(int fd) 


5 struct flock lock; 

6 lock.l type - F WRLCK; 

7 lock.l whence - SEEK SET; 

8 lock.l start = 0; 

9 lock.l len = 0; /* write lock entire file */ 
10 Fcntl(fd, F SETLKW, &lock); 

D a 

12 void 

13 my unlock(int fd) 

14 ( 

15 struct flock lock; 

16 lock.l type - F UNLCK; 

17 lock.l whence - SEEK SET; 

18 lock.l start - 0; 

19 lock.l len - 0; /* unlock entire file */ 
20 Fcntl(fd, F SETLK, &lock); 

21 ) 


lock/lockfentl.c 


图 9-3 Posix fcntl 上 锁 

我 们 不 给 出 结果 输出 ， 但 它 看 来 是 正确 的 。 需 认识 到 运行 像 图 9-2 
这 样 的 简单 程序 不 足以 告诉 我 们 程序 是 否 正 常 工作 。 如 果 输 出 像 我 们 
先前 看 到 的 那样 是 错误 的 ， 那 么 可 以 断言 程序 不 正确 ， 但 是 如 果 只 运 
行 它 的 两 个 副本 ， 每 个 副本 只 循环 20 次 ， 那 么 测试 是 不 充分 的 。 内 核 
可 能 运行 一 个 程序 更 新 序列 号 20 次 ， 再 运行 男 一 个 程序 更 新 序列 号 20 
次 。 如 采 这 两 个 进程 中 途 不 发 生 切 换 ， 我 们 惑 可 能 永远 发 现 不 了 错 


TR ° 


更 好 的 测试 是 : ERAI Amanoa K9-3 PIA, 3507 


main KA 45 Fr 41] 5 JH LE Aik, SEUKATBERNBIASBE RS HE. WRK 
们 把 序列 号 初始 化 为 1， 然 后 同时 运行 该 程序 的 20 个 副本 ， 那 么 序列 号 
文件 的 最 终 值 应 该 是 200 001 ° 


填写 
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9.3.2 例子 : 简化 用 的 宏 
请 求 或 释放 一 个 锁 需 6 行 代码 。 我 们 必须 分 配 一 个 结构 ， 
个 结构 ， 然 后 调用 fcntl。 通 过 定义 来 目 APUE 的 12.3 世 的 以 下 7 个 
Š 以 简化 我 们 的 程序 : 
#define read_lock(fd,offset,whence,len)\ 
lock_reg(fd,F_SETLK,F_RDLCK,offset,whence,len) 
#define readw_lock(fd,offset,whence,len)\ 
lock_reg(fd,F_SETLKW,F_RDLCK, offset,whence,len) 
#define write lock(fd,offset,whence,len) 
lock reg(fdjaF SETLK,F WRLCK,offset,whence,len) 
#define writew_lock(fd,offset,whence,len)\ 
lock_reg(fd,F_SETLKW,F_WRLCK,offset,whence,len) 
#define un_lock(fd,offset,whence,len)\ 
lock_reg(fd,F_SETLK,F_UNLCK,offset,whence,len) 
#define is_read_lockable(fd,offset,whence,len)\ 
!'lock_test(fd,F_RDLCK, offset,whence,len) 
#define is write lockable(fd,offset,whence,len) 
lock test(fd,F WRLCK,offset,whence,len) 
这 些 宏 使 用 我 们 的 lock_reg 和 lock_test 函 数 ， 它 们 在 图 9- dU 5 中 


给 出 。 使 用 这 些 宏 时 ， 不 必 考 虑 flock 结 构 和 真正 调用 的 范 数 。 这 些 宏 
的 前 三 个 参数 有 意 安排 成 跟 lseek 函 数 的 前 三 个 参数 相同 。 


lib/lock reg.c 


1 #include "unpipc.h" 
2 unt 
3 lock reg(int fd, int cmd, int type, off t offset, int whence, off t len) 
E 
5 struct flock lock; 
6 lock.l type - type; /* F RDLCK, F WRLCK, F UNLCK */ 
7 lock.1 start = offset; /* byte offset, relative to 1 whence */ 
8 lock.l whence - whence;  /* SEEK SET, SEEK CUR, SEEK END */ 
9 lock.1 len = len; /* #bytes (0 means to EOF) */ 
10 return( fcntl(fd, cmd, &lock) ); /* -1 upon error */ 
TT ] 
lib/lock reg.c 
图 9-4 调用 fcntl 获 取 或 释放 一 个 锁 
lib/lock test.c 
1 #include "unpipc.h" 
2 pid t 
3 lock test(int fd, int type, off t offset, int whence, off t len) 
4 { 
5 struct flock lock; 
6 lock.l type = type; /* F_RDLCK or F_WRLCK */ 
7 lock.l_start = offset; /* byte offset, relative to l_whence */ 
8 lock.1 whence = whence; /* SEEK SET, SEEK CUR, SEEK END */ 
9 lock.1 len = len; /* #bytes (0 means to EOF) */ 
10 if (fecntl(fd, F GETLK, &lock) == -1) 
11 return(-1); /* unexpected error */ 
12 if (lock.1 type == F UNLCK) 
13 return(0); /* false, region not locked by another proc */ 
14 return (lock.1 pid); /* true, return positive PID of lock owner */ 
15 } 


lib/lock_test.c 


图 9-5 调用 fcnd 测 试 一 个 锁 


我 们 还 定义 了 两 个 包 庄 函数 Lock_reg 和 Lock _test， 它 们 在 fcnd 出 错 
时 输出 一 个 错误 并 终止 。 男 有 7 个 同名 但 首 字 母 大 写 的 宏 ， 它 们 调用 这 
WT ELSE ER © 

使 用 这 些 宏 ， 图 9-3 中 的 my_lock 和 my_unlock 函 数 变 为 : 

#define my. lock(fd) (Writew_lock(fd,0,SEEK_SET,0)) 

#define my_unlock(fd) (Un_lock(fd,0,SEEK_SET,0)) 


9.4 劝告 性 上 锁 


Posix 记 录 上 锁 称 为 劝告 性 上 锁 (advisory locking) 。 共 含义 是 内 
核 维护 春 已 由 各 个 进程 上 锁 的 所 有 文件 的 正确 信息 ， 但 是 它 不 能 防止 
miu 写 已 由 另 一 个 进程 读 锁 定 的 某 个 文件 。 idis 它 也 不 能 防 

一 个 进程 读 已 由 男 一 个 进程 写 锁定 的 某 个 文件 。 进程 能 够 无 视 
EX EN A 或 者 读 一 人 1 eoe ut. Bil fe 
该 进程 有 读 或 写 该 文件 的 足够 权限 。 

劝告 性 锁 对 于 协作 进程 (cooperating processes) 是 足够 了 。 网 络 编 
程 中 守护 程序 的 编写 是 协作 进程 的 一 个 例子 : 这 些 程序 访问 诸如 序列 
SZ RAF BR, MAAR AR En el Re RRS A 
序列 号 的 真正 文件 不 是 任何 进程 都 可 写 ， 那 么 在 该 文件 被 锁 住 期 间 ， 
不 理会 劝告 性 锁 的 随意 进程 无 法 写 它 

例子 : 非 协 作 进程 

通过 运行 我 们 的 序列 号 程序 的 两 个 实例 ， 就 能 展示 Posix 记 录 上 锁 
是 劝告 性 的 ， 这 两 个 实例 是 : 使 用 图 9-3 中 国 数 的 lockfcnt， 它 在 给 序 
列 号 加 1 前 完 锁 住 文件 ， 以 及 使 用 图 9-1 中 范 数 的 locknone， 它 不 执行 上 
a 

solaris % lockfcntl & locknone & 

lockfcntl: pid = 18816,seq# = 1 

lockfcntl: pid = 18816,seq# = 2 

lockfcntl: pid = 18816,seq# = 3 

lockfcntl: pid = 18816,seq# = 4 

lockfcntl: pid = 18816,seq# = 5 

lockfcntl: pid = 18816,seq# = 6 

lockfcntl: pid = 18816,seq# = 7 

lockfcntl: pid = 18816,seq# = 8 

lockfcntl: pid = 18816,seq# = 9 

lockfcntl: pid = 18816,seq# = 10 


lockfcntl: pid = 18816,seq# = 11 

locknone: pid = 18817,seq# = 11 切换 进程 ;， 出错 
locknone: pid = 18817,seq# = 12 

locknone: pid = 18817,seq# = 13 

locknone: pid = 18817,seq# = 14 

locknone: pid = 18817,seq# = 15 

locknone: pid = 18817,seq# = 16 

locknone: pid = 18817,seq# = 17 

locknone: pid = 18817,seq# = 18 

lockfcntl: pid = 18816,seq# = 12 切换 进程 ， 出错 
lockfcntl: pid = 18816,seq# = 13 

lockfcntl: pid = 18816,seq# = 14 

lockfcntl: pid = 18816,seq# = 15 

lockfcntl: pid = 18816,seq# = 16 

lockfcntl: pid = 18816,seq# = 17 

lockfcntl: pid = 18816,seq# = 18 

lockfcntl: pid = 18816,seq# = 19 

lockfcntl: pid = 18816,seq# = 20 

locknone: pid = 18817,seq# = 19 切换 进程 ;出 销 
locknone: pid = 18817,seq# = 20 

locknone: pid = 18817,seq# = 21 

locknone: pid = 18817,seq# = 22 

locknone: pid = 18817,seq# = 23 

locknone: pid = 18817,seq# = 24 

locknone: pid = 18817,seq# = 25 

locknone: pid = 18817,seq# = 26 

locknone: pid = 18817,seq# = 27 


locknone: pid = 18817,seq# = 28 

locknone: pid = 18817,seq# = 29 

locknone: pid = 18817,seq# = 30 

lockfcntl 程 序 首 先 运 行 ， 但 是 在 它 执行 将 序列 号 从 11 增 加 到 12 的 三 
个 步骤 期 间 〈 此 间 它 持 有 整个 文件 的 锁 ) ， 内 核 切换 进程 ， 并 且 
locknone 程 序 运 行 。 该 新 程序 读 出 的 序列 号 值 是 lockfcnt 程 序 写 回 序列 
号 文件 之 前 的 11。 由 lockfcnt 程 序 持 有 的 劝告 性 记录 锁 对 locknone 程 序 
没有 影响 。 


9.5 性 上 锁 


有 些 系 统 提供 另 一 种 类 型 的 记录 上 锁 ， 称 为 强制 性 上 锁 
(mandatory locking) 。 使 用 强制 性 锁 后 ， 内 核 检查 每 个 read 和 write 请 
求 ， 以 验证 其 操作 不 会 干扰 由 某 个 进程 持 有 的 某 个 锁 。 对 于 通 香 的 阻 
塞 式 朱 述 符 ， 与 某 个 强制 性 锁 神 突 的 read 或 write 将 把 调用 进程 投入 睡 
有 眠 ， 直 到 该 锁 释 放 为 止 。 对 于 非 阻 堵 式 摘 述 符 ， 与 某 个 强制 性 锁 神 突 
的 read 或 write 将 导致 它们 返回 一 个 EAGAIN 错 误 。 

Posix.1 和 Unix 98 只 定义 劝告 性 上 锁 。 然 而 源 目 System V 的 许多 实 
现 却 同时 提供 劝告 性 上 锁 和 强制 性 上 锁 。 强 制 性 记录 上 锁 是 随 System 
V Release 3 引入 的 。 

为 对 某 个 特定 文件 施行 强制 性 上 锁 ， 应 满足 : 

组 成 员 执 行 位 必须 天 挥 ; 

SGID 位 必须 打开 。 

注意 ， 打 开 某 个 文件 的 SUID 位 而 不 打开 它 的 用 户 执行 位 是 没有 意 
义 的 ， 同 样 ， 打 开 SGID 位 而 不 打开 组 成 员 执 行 位 也 没有 意义 。 因 此 ， 
以 这 种 方式 加 上 的 强制 性 锁 不 会 影响 任何 现 有 的 用 户 软 件 。 强 制 性 上 
锁 不 需要 新 的 系统 调用 。 


在 支持 强制 性 记录 上 锁 的 系统 上 ，1ls 命 令 查 找 权 限 位 的 这 种 特殊 组 
合 ， 并 输出 1] 或 L 以 指示 相应 文件 的 强制 性 上 锁 是 否 启用 。 类 似 地 ， 
chmod 命 令 接 受 ] 这 个 指示 符 以 给 某 个 文件 启用 强制 性 上 锁 。 

例子 

初 看 起 来 ， 使 用 强制 性 上 锁 应 该 解决 非 协 作 进程 的 问题 ， 因 为 非 
协作 进程 对 被 锁 住 文件 的 任何 read 或 write 调 用 都 将 阻 军 进程 本 吴 ， 直 到 
该 文件 的 锁 被 释放 为 止 。 不 驻 的 是 ， 定 时 间 题 相当 复杂 ， 这 一 点 我 们 
很 容易 展示 。 

要 把 我 们 使 用 fcntl 的 例子 转换 成 使 用 强制 性 上 锁 ， 所 需 做 的 是 修改 
seqno 文 件 的 权限 位 。 我 们 还 改 用 男 一 个 版 本 的 main 芳 数 ， 它 的 for 循 环 
次 数 取 自 第 一 个 命令 行 参数 〈 而 不 是 使 用 常 值 20) ， 每 次 循环 时 不 再 
调用 printf 。 


solaris 96 cat > seqno 首先 把 序列 号 值 初 
台 化 为 1 

1 

^D Ctrl+D 


我 们 的 终端 文件 结束 符 

solaris 96 Is -l seqno 

-rw-r--r-- 1 rstevens other1 2O0ct 7 11:24 seqno 

solaris % chmod +1 seqno 局 用 强制 性 上 锁 

solaris 96 Is -l seqno 

-rw-r-lr-- 1 rstevens other1 2Oct 7 11:24 seqno 

现在 在 后 台 启 动 两 个 程序 : loopfcnt 使 用 fcntt 上 锁 ，loopnone 不 上 
锁 。 所 指定 的 命令 行 参数 为 10 000， 它 是 每 个 程序 读 出 、 加 1 再 写 入 序 
列 号 的 次 数 。 

solaris 96 loopfcntl 10000 & loopnone 10000& 在 后 台 同 时 启动 两 
个 程序 


solaris 96 wait SER 
个 后 人 台 作 业 的 完成 

solaris % cat Seqno 然后 查看 序 
WS 

14378 
fa: 应 该 是 20 001 

每 次 运行 这 两 个 程序 ， 最 终 的 序列 号 通常 在 14 000 和 16 000 之 间 。 
如 果 上 锁 像 期 望 的 那样 工作 的 话 ， 最 终 值 应 该 尽 是 为 20 001。 为 查看 错 
误 发 生 位 置 ， 我 们 需要 画 出 具体 到 每 个 步骤 的 时 间 线 图 ， 如 图 9-6 所 
示 。 
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3. read() > 1 
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13. 加 1 
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15. 解锁 文件 
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locknone 


10. open () 


. read () [H.E 


17. read () 一 3 
18. 加 1 

19. write () 一 4 
20. read () 一 4 
21 
22. write () 一 5 
23. read () 一 


.加 1 


36. 加 1 
37. write() 一 0 


图 9-6 loopfcntt 和 1loopnone 程 序 的 时 间 线 图 


我 们 假设 loopfcntl 程 序 首先 司 动 ， 执 行 图 中 所 示 前 8 个 步骤 。 然 后 
内 核 在 loopfentl 持 有 序列 号 文件 的 一 个 记录 锁 期 间 切 换 进 程 。 于 是 
loopnone 启 动 ， 但 是 它 的 第 一 个 read 阻 塞 了 ， 因 为 它 想 从 中 读 出 序列 号 
的 文件 有 一 个 由 男 一 个 进程 持 有 的 未 释放 强制 性 锁 。 我 们 假设 内 核 把 
进程 切换 回 第 一 个 程序 ， 由 它 执 行 第 13、14 和 15 步 。 这 是 我 们 期 待 的 
行为 : 内核 阻塞 来 自 非 协作 进程 的 read， 因 为 它 试 图 读 的 文件 由 男 一 个 
进程 锁 着 。 

然后 内 核 切换 进程 到 locknone 程 序 ， 由 它 执 行 第 17~23 步 。 这 些 步 
骤 中 的 read 和 write 是 允许 的 ， 因 为 第 一 个 程序 已 在 第 15 步 给 序列 号 文件 
解锁 。 然 而 ， 当 该 程序 在 第 23 步 read 到 值 为 5 的 序列 号 ， 接 着 内 核 切换 
到 第 一 个 进程 时 ， 问 题 就 发 生 了 。 第 一 个 进程 接着 给 序列 号 值 加 1 两 
次 ， 然 后 在 第 二 个 进程 运行 第 36 步 前 存 入 一 个 值 为 7 的 序列 号 。 但 是 第 
二 个 进程 往 序列 号 文件 写 入 的 值 却 为 6， 这 是 错误 的 。 

我 们 从 这 个 例子 中 看 到 的 是 ， 尽 管 强制 性 上 锁 阻 止 了 非 协 作 进程 
读 一 个 已 被 锁 住 的 文件 〈 第 11 步 ) ， 但 是 仍 没 有 解决 问题 。 问 题 出 在 
当 右 边 的 进程 处 于 更 新 序列 号 的 三 个 步骤 〈 第 23、36 和 37 步 ) 期 间 
时 ， 左 边 的 进程 是 允许 更 新 序列 号 文件 的 〈 第 25~34 步 ) 。 如 果 有 多 
个 进程 在 更 新 一 个 文件 ， 那 么 所 有 进程 必须 使 用 某 种 上 锁 形 式 协 作 。 
只 要 一 个 进程 违规 瓯 可 能 引发 大 混乱 。 


9.6 读 出 者 和 写 入 者 的 优先 级 


在 8.4 世 我 们 的 读 写 锁 实现 中 ， 优 移 考 虑 的 是 等 竺 看 的 写 人 者 而 不 
是 等 待 着 的 读 出 者 。 现 在 看 看 由 fcnti 记 录 上 锁 提 供 的 解决 读 出 者 与 写 入 
者 问题 的 办 法 的 某 些 细 玉 。 我 们 想 看 到 的 是 ， 当 一 个 文件 区 已 被 锁 住 
时 ， 竺 处 理 的 上 锁 请 求 是 如 何 处 理 的， 这 是 Posix 未 曾 说 明 的 。 


9.6.1 例子 : 某 个 写 入 锁 待 处 理 期 间 的 额外 读 出 锁 

我 们 问 的 第 一 个 问题 是 : 如 采 某 个 歇 源 已 经 读 锁 定 ， 并 有 一 个 写 
入 锁 请 求 在 等 竺 处 理 ， 那 么 是 否 多 许 有 另 一 个 读 出 锁 ? 某 些 解决 读 出 
者 与 写 入 者 问题 的 办 法 不 允许 在 已 有 一 个 写 入 着 等 和 着 的 情况 下 再 增 
加 一 个 读 出 者 ， 因 为 要 是 不 断 允 许 新 的 读 出 请 求 的话 ， 待 处 理 的 写 入 
请 求 存 在 水 远 不 锌 允许 的 可 能 性 。 

为 测试 fcntli 记 录 上 锯 十 如 何 处 理 这 种 情形 的 ， 我 们 编写 一 个 测试 程 
序 ， 它 获取 某 个 完整 文件 的 一 个 读 出 锁 ， 然 后 fork 两 个 子 进 程 。 第 一 个 
子 进 程 痢 先 尝试 获取 一 个 写 入 锁 ( 它 将 阻塞 ， 因 为 父 进程 已 持 有 整个 
文件 的 一 个 读 出 锁 ) ， 然 后 由 第 二 个 进程 党 试 获取 一 个 读 出 锁 。 图 9-7 
展示 了 这 些 请 求 的 时 间 线 图 ， 图 9-8 给 出 了 我 们 的 测试 程序 。 
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图 9-7 确定 有 一 个 写 入 锁 待 处 理 
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lock/test2.c 


1 #include "unpipc.h" 

2 unt 

3 main(int argc, char **argv) 

41 

5 int fd; 

6 fd = Open("test1.data", O RDWR | O CREAT, FILE MODE); 

7 Read lock(fd, 0, SEEK SET, 0); /* parent read locks entire file */ 
8 printf("$s: parent has read lock\n", Gf time()); 

9 if (R6EK() == 0) { 

10 /* first child */ 

Td sleep(1); 

12 printf("$s: first child tries to obtain write lock\n", Gf time()); 
13 Writew lock(fd, 0, SEEK SET, 0); /* this should block */ 
14 printf("$s: first child obtains write lock\n", Gf time()); 
15 sleep(2); 

16 Un lock(fd, 0, SEEK SET, 0); 

17 printf("$s: first child releases write lock\n", Gf time()); 
18 exit(0); 

19 ) 

20 if (Fork() == 0) ( 

24 /* second child */ 

22 sleep(3); 

23 printf("$s: second child tries to obtain read lock\n", Gf time()); 
24 Readw lock(fd, 0, SEEK SET, 0); 

25 printf("$s: second child obtains read lock\n", Gf time()); 
26 sleep(4); 

27 Un lock(fd, 0, SEEK SET, 0); 

28 printf("$s: second child releases read lockMn", Gf time()); 
29 exit(0); 

30 } 

31 /* parent */ 

32 sleep (5) ; 

33 Un lock(fd, 0, SEEK SET, 0); 

34 printf ("%s: parent releases read lock\n", Gf _time()) ; 

35 exit (0); 

36 } 


lock/test2.c 


图 9-8 确定 在 有 一 个 写 入 锁 待 处理 


期 间 是 否 允 许 有 必 一 个 读 出 锁 


父 进程 打开 文件 并 获取 读 出 锁 


6—8 父 进程 打开 文件 ， 并 获取 整个 文件 的 读 出 锁 。 注 意 ， 我 们 调 
用 read_lock 〈 它 不 阻塞 ， 但 当 无 法 取得 锁 时 会 返回 一 个 错误 ) 而 不 是 


readw lock 〈 它 可 能 等 待 ) ， 因 为 预 
上 时， 输出 市 有 当前 时 间 的 一 个 消息 


XD 。 


fork 第 一 个 子 进 程 


期 该 锁 会 立即 取得 。 当 取得 该 锁 
(f FH UNPvVI SS 404 0 BJ gf. time ER 


9~19 创建 第 一 个 子 进程 ， 它 睡眠 1 秒 ， 然 后 阻塞 ， 等 待 整个 文件 
的 一 个 写 入 锁 。 当 取得 该 写 入 锁 时 ， 该 进程 持 有 它 2 秒 后 即 释 放 它 ， 然 
后 终止 。 

fork 第 二 个 子 进 程 

20~30 创建 第 二 个 子 进程 ， 它 睡眠 3 秒 以 允许 第 一 个 子 进程 的 写 入 
锁 处 于 待 处 理 状态 ， 然 后 符 试 获取 整个 文件 的 一 个 读 出 锁 。 到 时 候 我 
fi TL BE FE readw_locki [BT] 48 WAT BF) 

定 ， 该 读 出 锁 是 被 排 入 请 求 队列 了 还 是 立即 给 予 了 。 该 锁 持 有 4 秒 
后 被 释放 。 

父 进程 持 有 读 出 锁 5 秒 

31~35 父 进程 挂 有 读 出 锁 5 秒 后 ， 释 放 该 锁 ， 然 后 终止 。[4] 

图 9-7 所 示 的 时 间 线 图 是 我 们 在 Solaris 2.6、Digital Unix 4.0B 和 
BSD/OS 3.1 下 看 到 的 情形 。 也 就 是 说 ， 即 使 已 有 来 自 第 一 个 子 进程 的 
一 个 每 处 理 写 入 锁 请 求 ， 第 二 个 子 进程 请 求 的 读 出 锁 也 是 立即 给 
的 。 这 么 一 来 ， 只 要 连续 不 断 地 发 出 读 出 锁 请 求 ， 写 入 者 就 可 能 因 获 
取 不 了 写 入 锁 而 “ 挨 饿 ?”。 下 面 是 程序 的 输出 ， 我 们 在 大 的 时 间 事 件 之 
间 插 入 些 空 日 行 ， 以 改善 可 读 性 : 

alpha 96 test2 

16:32:29.674453: parent has read lock 

16:32:30.709197: first child tries to obtain write lock 16:32:32.725810: 
second child tries to obtain read lock 

16:32:32.728739: second child obtain read lock 

16:32:34.722282: parent releases read lock 16:32:36.729738: second 
child releases read lock 

16:32:36.735597: first child obtains write lock 

16:32:38.736938: first child releases write lock 

9.6.2 例子 : 等 待 着 的 写 入 者 是 否 比 等 待 着 的 读 出 者 优先 


我 们 问 的 下 一 个 问题 是 : 等 待 着 的 写 入 者 比 等 待 着 的 读 出 者 更 优 
先 吗 ? 某 些 解决 读 出 者 与 写 入 者 问题 的 办 法 内 置 着 这 样 的 优先 关系 。 

图 9-9 是 我 们 的 测试 程序 ， 图 9-10 是 该 测试 程序 的 时 间 线 图 。 

父 进 程 创建 文件 并 获取 写 入 锁 

6--8 父 进程 创建 一 个 文件 ， 并 获取 整个 文件 的 一 个 写 入 锁 。 

fork 第 一 个 子 进 程 

9~19 派生 第 一 个 子 进程 ， 它 睡眠 1 秒 后 请 求 整个 文件 的 一 个 写 入 
锁 。 我 们 知道 这 将 阻塞 ， 因 为 父 进程 已 获取 整个 文件 的 一 个 写 入 锁 并 
且 持 有 它 5 秒 ， 不 过 我 们 期 每 父 进 程 持 有 的 锁 释 放 时 ， 本 请 求 已 排 入 
Bh o 

fork 第 二 个 子 进 程 

20~30 派生 第 二 个 子 进 程 ， 它 睡眠 3 秒 后 请 求 整个 文件 的 一 个 读 出 
锁 。 当 父 进程 释放 持 有 的 写 入 锁 时 ， 本 请 求 也 将 排 入 了 从 。 

在 Solaris 2.6 和 Digital Unix 4.0B 下， 我 们 看 到 第 一 个 子 进程 的 写 入 
锁 先 于 第 二 个 子 进 程 的 读 出 锁 取 得 ， 如 图 9-10 所 示 “。 但 是 这 不 足以 告诉 
我 们 写 入 锁 比 读 出 锁 优先 ， 因 为 其 原因 可 能 是 内 核 以 FIFO 顺 序 准予 上 
锁 请 求 ， 而 不 管 它们 是 读 出 锁 还 是 写 入 锁 。 为 验证 之 ， 我 们 创建 另外 
一 个 与 图 9-9 几 乎 相同 的 测试 程序 ， 不 过 读 出 锁 请 求 是 在 第 1 秒 发 生 ， 写 
入 锁 请 求 是 在 第 3 秒 发 生 。 前 后 两 个 测试 程序 表明 ，Solaris 和 Digital 
Unix 是 以 FIFO 顺 序 处 理 上 锁 请 求 的 ， 而 不 管 上 锁 请 求 的 类 型 。 这 两 个 
程序 还 表明 ，BSD/OS 3.1 优 先 考虑 读 出 请 求 。 


lock/test3.c 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 int fd; 

6 fd = Open("test1.data", O_RDWR | O CREAT, FILE MODE); 

7 Write lock(fd, 0, SEEK SET, 0); /* parent write locks entire file */ 
8 printf("$s: parent has write lock\n", Gf time()); 

9 if (Fork() == 0) ( 

10 /* first child */ 

11 sleep(1); 

12 printf("$s: first child tries to obtain write lockWMn", Gf time()); 
13 Writew lock(fd, 0, SEEK SET, 0); /* this should block */ 
14 printf("$s: first child obtains write lock\n", Gf time()); 
15 sleep (2); 

16 Un lock(fd, 0, SEEK SET, 0); 

17 printf("$s: first child releases write lock\n", Gf time()); 
18 exit(0); 

19 ) 

20 if (Fork() == 0) { 

21 /* second child */ 

22 sleep(3); 

23 printf("$s: second child tries to obtain read lockWMn", Gf time()); 
24 Readw lock(fd, 0, SEEK SET, 0); 

25 printf("$s: second child obtains read lock\n", Gf time()); 
26 sleep(4); 

27 Un lock(fd, 0, SEEK SET, 0); 

28 printf("$s: second child releases read lock\n", Gf time()); 
29 exit(0); 

30 ) 

31 /* parent */ 

32 sleep(5); 

33 Un lock(fd, 0, SEEK SET, 0); 

34 printf("$s: parent releases write lock\n", Gf time()); 

35 exit (0); 

36 } 


lock/test3.c 


图 9-9 测试 写 入 者 是 否 比 读 出 者 优先 

下 面 是 图 9-9 中 程序 的 输出 ， 我 们 就 是 以 此 构造 出 图 9-10 所 示 的 时 
间 线 图 的 。 

alpha % test3 

16:34:02.810285: parent has write lock 

16:34:03.848166: first child tries to obtain write lock 

16:34:05.861082: second child tries to obtain read lock 


16:34:07.858393: parent releases write lock 
16:34:07.865222: first child obtains write lock 
16:34:09.865987: first child releases write lock 
16:34:09.872823: second child obtains read lock 
16:34:13.873822: secound child releases read lock 
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图 9-10 测试 写 入 者 是 否 比 读 出 者 优先 


9.7 启动 一 个 守护 进程 的 唯一 副 


记录 上 锁 的 一 个 常见 用 途 是 确保 某 个 程序 (例如 守护 程序 ) 在 任 
何 时 刻 只 有 一 个 副本 在 运行 。 图 9-11 给 出 了 一 个 守护 程序 启动 时 将 执行 
的 代码 片段 。 

打开 一 个 文件 并 为 其 上 锁 

8 一 17 守护 进程 维护 一 个 只 有 1 行文 本 的 文件 ， 其 中 含有 它 的 进程 
ID 。 它 打开 这 个 文件 ， 必 要 的 话 创建 之 ， 然 后 请 求 整 个 文件 的 一 个 写 
入 锁 。 如 有 果 没 有 取得 该 锁 ， 我 们 束 知 道 该 程序 有 另 一 个 副本 在 运行 ， 
于 是 输出 一 个 出 错 消息 并 终止 。 

许多 Unix 系 统 让 它们 的 守护 进程 把 各 自 的 进程 ID 写 到 一 个 文件 
中 。 Solaris 2.6 在 /etc 目 录 下 存放 了 其 中 一 些 文 件 。Digital Unix 和 
BSD/OS 则 在 /var/run 目 录 下 存放 这 些 文件 。 

把 本 进程 PID 写 入 文件 

18~21 把 所 打开 的 文件 截 为 0， 然 后 写 入 含有 本 进程 PID 的 一 行文 
本 。 截 短 该 文件 的 原因 是 ， 该 程序 先前 的 副本 ( 壁 如 说 在 系统 重新 自 
举 前 执行 的 副本 ) 可 能 有 一 个 值 为 23456 的 进程 ID， 而 本 副本 的 进程 ID 
为 123。 要 是 光 写 入 那 一 行 而 不 预先 截 短 ， 那 么 文件 内 容 将 会 是 
123m6n。 尺 管 第 一 行 仍然 含有 本 进程 的 进程 DD， 避 人 免 该 文件 中 出 现 第 
二 行 的 可 能 却 更 为 清晰 ， 更 不 易 引 起 混淆 。 


lock/onedaemon.c 


1 #include "unpipc.h" 
2 #define PATH PIDFILE "pidfile" 
3 int 


4 main(int argc, char **argv) 


5 { 


6 int pidfd; 

7 char line [MAXLINE] ; 

8 /* open the PID file, create if nonexistent */ 

9 pidfd - Open(PATH PIDFILE, O RDWR | O CREAT, FILE MODE); 

10 /* try to write lock the entire file */ 

d if (write lock(pidfd, 0, SEEK SET, 0) < 0) { 

12 if (errno -- EACCES || errno -- EAGAIN) 

13 err quit("unable to lock $s, is $s already running?", 
14 PATH PIDFILE, argv[0]); 

15 else 

16 err sys("unable to lock $s", PATH PIDFILE); 

17 ) 

18 /* write my PID, leave file open to hold the write lock */ 
19 snprintf(line, sizeof(line), "%ld\n", (long) getpid()); 

20 Ftruncate (pidfd, 0); 

21 Write(pidfd, line, strlen(line)); 

22 /* then do whatever the daemon does ... */ 

23 pause () ; 

24 } 


lock/onedaemon.c 


图 9-11 确保 某 个 程序 只 有 一 个 副本 在 运行 
下 面 是 图 9-11 中 程序 的 一 个 测试 结 


solaris 96 onedaemon & 局 动 第 一 个 副本 
solaris % cat pidfile 分 查 写 入 文件 中 的 PID 
solaris % onedaemon 然后 尝试 启动 第 二 个 部 


[1] 22388 22388 

unable to lock pidfile,is onedaemon already running? 

一 个 守护 进程 还 有 其 他 方法 防止 自身 男 一 个 副本 启动 ， 壁 如 说 可 
能 使 用 信号 量 。 本 市 所 示 的 方法 的 优势 在 于 ， 许 多 守护 程序 都 编写 成 
同 某 个 文件 写 入 本 进程 ID， 而 且 如 果 某 个 守护 进程 过 早 朋 浇 了 ， 那 么 
内 核 会 目 动 释放 它 的 记录 锁 。 


9.8 锁 用 


Posix.1 保 证 ， 如 果 以 O_CREAT ( 若 文 件 不 存在 则 创建 它 ) 和 
O EXCL (独占 打开 ) 标志 调用 open 画 数 ， 那 么 一 旦 该 文件 已 经 存在 ， 
该 函数 就 返回 一 个 错误 。 而 且 考 虑 到 其 他 进程 的 存在 ， 检 查 该 文件 是 
否 存 在 和 创建 该 文件 (如 果 它 还 不 存在 ) 必须 是 原子 的 。 因 此 ， 我 们 
可 以 把 以 这 种 技巧 创建 的 文件 作为 锁 使 用 。Posix.1 保 证 任何 时 候 只 有 
一 个 进程 能 够 创建 这 样 的 文件 (也 就 是 获取 锁 ) ， 释 放 这 样 的 锁 只 需 
unlink 该 文件 。 

图 9-12 给 出 了 使 用 这 种 技巧 的 上 锁 函 数 的 一 个 版 本 。 如 果 open 成 
功 ， 我 们 就 挂 有 与 所 创建 文件 对 应 的 锁 ， 于 是 my_lock 画 数 可 以 返回 。 
返回 前 还 close 该 文件 ， 因 为 我 们 并 不 需要 它 的 描述 符 : 该 文件 的 存在 
本 身 代表 锁 ， 至 于 它 是 否 打 开 则 无 关 紧 要 。 如 果 open 返 回 一 个 EEXIST 
背 误 ， 那 么 该 文件 已 经 存在 ， 于 是 我 们 再 次 尝试 open。 


lock/lockopen.c 


1 #include "unpipc.h" 
2 #define LOCKFILE "/tmp/seqno. lock" 
3 void 


4 my_lock(int fd) 
5 { 


6 int tempfd; 

7 while ( (tempfd = open(LOCKFILE, O RDWR|O CREAT|O EXCL, FILE MODE)) < 0){ 
8 if (errno !- EEXIST) 

9 err sys("open error for lock file"); 

10 /* someone else has the lock, loop around and try again */ 

1T } 

12 Close (tempfd) ; /* opened the file, we have the lock */ 

13 } 

14 void 


15 my_unlock(int fd) 
16 { 
17 Unlink (LOCKFILE) ; /* release lock by removing file */ 


18 } 
lock/lockopen.c 


图 9-12 使 用 指定 O _CREAT 和 O_EXCL 标 志 的 open 实 现 的 锁 函 数 


这 种 技巧 存在 以 下 三 个 问题 。 


(1) 如 果 当 前 持 有 该 锁 的 进程 没有 释放 它 束 终止 ， 那 么 其 文件 名 并 
未 删除 。 对 付 这 个 问题 有 一 些 特别 的 技巧 ， 例 如 检查 该 文件 的 最 近 访 
问 时 间 ， 如 采 它 有 一 段 大 于 某 个 确定 数量 的 时 间 未 曾 访 问 ， 那 惑 假设 
它 已 被 遗 筷 ， 不 过 这 些 技巧 没有 一 个 是 完善 的 。 另 一 个 技巧 是 把 持 有 
该 锁 的 进程 的 进程 ID 写 入 其 锁 文 件 中 ， 这 样 其 他 进程 可 以 读 出 该 进程 
ID， 并 检查 该 进程 是 否 仍 在 运行 。 这 也 是 不 完善 的 ， 因 为 进程 ID 在 过 
一 段 时 间 后 会 被 重用 。 

这 种 情形 对 fcnti 记 录 上 锁 而 言 不 成 问题 ， 因 为 当 某 个 进程 终止 时 ， 
由 它 持 有 的 任何 记录 锁 都 目 动 释放 。 

(2) 如 采 另 外 某 个 进程 已 打开 了 锁 文 件 ， 那 么 当前 进程 只 是 在 一 个 
无 限 循 环 中 一 次 又 一 次 地 调用 open。 这 称 为 轮 询 ， 是 对 CPU 时 间 的 一 
种 浪费 。 一 种 替换 技巧 是 sleep 1 秒 ， 然 后 再 次 尝试 open。 (我 们 在 图 7- 
5 中 看 到 了 同样 的 问题 。) 

如 果 使 用 fcnd 记 录 上 锁 ， 这 瓯 不 成 问题 ， 前 提 是 想 要 持 有 该 锁 的 进 
程 指 定 FSETLKW 命 令 。 内 核 将 把 该 进程 投入 睡眠 ， 直 到 该 锁 可 用 ， 然 
后 唤醒 它 。 

(3) 调 用 open 和 unlink 创 建 和 删除 一 个 额外 的 文件 涉及 文件 系统 的 访 
问 ， 这 通常 比 调用 fcnt 两 次 〈 一 次 用 于 获取 锁 ， 一 次 用 于 释放 锁 ) BRE 
时 间 长 得 多 。 测 量 在 我 们 的 程序 中 给 序列 号 加 1 共 1000 次 的 循环 所 花 的 
执行 时 间 ， 发 现 fcntl 记 录 上 锁 比 调用 open 和 unlink 快 75 倍 。 

Unix 文 件 系统 的 另外 两 个 技巧 也 用 于 提供 特殊 的 上 锁 。 第 一 个 技 
巧 是 : 如 有 果 刹 链接 的 名 字 已 经 存在 ， 那 么 link 函 数 将 失败 。 为 获取 一 个 
锁 ， 首 先 创建 一 个 唯一 的 临时 文件 ， 其 路 径 名 中 含有 调用 进程 的 进程 
ID (如 采 不 同 进程 中 的 线程 则 以 及 同一 进程 内 的 线程 间 都 需要 上 锁 ， 
那么 所 含 的 是 进程 ID 和 线程 ID 的 某 种 组 合 ) 。 然 后 以 待 建立 锁 文 件 的 
众所周知 路 径 名 调用 link 函 数 创建 这 个 临时 文件 的 一 个 链接 。 如 果 创 建 
成 功 ， 该 临时 路 径 名 束 可 以 unlink 掉 。 当 调用 线程 使 用 完 该 锁 时 ， 只 需 


unlink 其 众所周知 的 路 径 名 就 可 以 解锁 。 如 果 link 失 败 返 回 EEXIST 错 
误 ， 调 用 线程 就 得 重新 尝试 (类 似 于 图 9-12 中 的 做 法 ) 。 这 种 技巧 的 要 
求 之 一 是 : 临时 文件 路 径 名 和 锁 文 件 众 所 周知 的 路 径 名 必须 都 存在 于 
同一 文件 系统 中 ， 因 为 多 数 版 本 的 Unix 不 允许 硬 链接 link EW Zi BJZ8 
TR) 跨越 不 同 的 文件 系统 。 

第 二 种 技巧 基于 : 如 果 待 打开 的 文件 已 经 存在 ， 打 开 时 指定 了 
O_TRUNC 标 志 ， 而 且 调 用 进程 不 具备 写 访问 权限 ， 那 么 open 调 用 将 返 
[|] — ^^ $8 Y& ^ 2g dX HX — T 9 , dE fl] E dB E 
O_CREATIO_WRONLYIO_TRUNC 标 志 并 置 mode 参 数 为 0 ( 即 新 文件 不 
打开 任何 权限 位 ) 的 前 提 下 调用 open。 如 果 调 用 成 功 ， 我 们 就 拥有 了 
该 锁 ， 以 后 使 用 完 该 锁 后 只 需 unlink 其 路 径 名 。 如 果 open 调 用 失败 返回 
EACCES 错 误 ， 那 么 调用 线程 必须 重新 尝试 (类似 于 图 9-12 中 的 做 
法 ) 。 需 要 注意 的 是 ， 这 种 技巧 在 调用 线程 具备 超级 用 户 特权 时 不 起 
作用 。 

从 这 些 例子 得 出 的 教训 是 :应 该 使 用 fcntl 记 录 上 锁 。 然 而 你 有 可 能 
磁 到 使 用 这 些 老 式 上 锁 技巧 的 代码 ， 它 们 通常 存在 于 fcntl 上 锁 尚 未 广泛 
得 以 实现 之 前 编写 的 程序 中 。 


9.9 NFS 上 锁 


NEFS 就 是 网 络 文件 系统 ， 它 在 TCPvl 第 29 章 中 讨论 。 作 为 对 NFS 的 
一 种 扩展 ，NFES 的 大 多 数 实现 支持 fcnt 记 录 上 锁 。Unix 系 统 通常 以 两 个 
额外 的 守护 进程 文 持 NFS 记 录 上 锁 ， 它 们 是 lockd 和 statd。 当 某 个 进程 
调用 fcntl 以 获取 一 个 锁 ， 而 且 内 核 检测 出 其 描述 符 引 用 通过 NFS 安 装 的 
某 个 文件 系统 上 的 一 个 文件 时 ， 本 地 的 lockd 就 向 服务 器 的 lockd 发 送 这 
个 请 求 。statd 守 护 进程 跟踪 着 持 有 锁 的 各 个 客户 ， 它 与 jockd 交 互 以 提 
供 NFS 上 锁 的 骨 溃 恢复 功能 。 


我 们 可 以 预期 NFS 文 件 的 记录 上 锁 比 本 地 文件 的 记录 上 锁 花 的 时 间 
长 ， 因 为 获取 与 释放 每 一 个 锁 都 需要 网 络 通信 。 为 测试 NFS 记 录 上 锁 ， 
我 们 只 需 修改 图 9-2 中 由 SEQFILE 指 定 的 文件 名 。 测 量 我 们 的 程序 使 用 
fcntl 记 录 上 锁 执 行 10 000 次 循环 所 需 的 时 间 ， 发 现 本 地 文件 的 记录 上 锁 
比 NFS 文 件 的 记录 上 锁 快 了 约 80 倍 。 还 要 留意 的 是 ， 当 序列 号 文件 在 某 
个 通过 NFS 安 装 的 文件 系统 上 时 ， 记 录 上 锁 和 序列 号 的 读 写 都 涉及 网 络 
通信 。 

防止 误解 的 说 明 : NFS 记 采 上 锁 多 年 来 一 直 是 个 问题 ， 它 甘 不 多 是 
由 不 理想 的 实现 所 导致 的 。 尽 管 主要 的 Unix 厂 家 已 最 终 清 理 了 它们 各 
目的 实现 ， 通 过 NFS 使 用 fentl 记 好 上 锁 对 于 许多 实现 来 说 仍然 是 一 个 严 
重 的 问题 。 我 们 不 会 在 这 个 问题 上 偏 诅 一 方 而 贬低 男 一 方 ， 只 是 指出 
fcnt 记 录 上 锁 在 NFS 上 也 应 该 起 作用 ， 不 过 实际 成 功 与 否 取决 于 实现 的 
质量 ， 客 户 端 和 服务 右 端 都 有 质量 要 求 。 


9.10 小 结 


fcnt 记 录 上 锁 提 供 了 对 一 个 文件 的 劝告 性 或 强制 性 上 锁 功 能 ， 而 我 
们 是 通过 该 文件 打开 奢 的 接 述 得 来 访问 它 的 。 这 些 锁 用 于 不 同 进程 间 
的 上 锁 ， 而 不 是 同一 进程 内 不 同 线程 间 的 上 锁 。 术 语 “ 记 录 ” 是 个 不 确 
切 的 名 字 ， 因 为 Unix 内 核 没有 文件 内 记录 的 概念 。 更 好 的 称 请 是 “ 施 围 
上 锁 (range locking) ”， 因 为 我 们 上 锁 或 解锁 的 是 文件 内 的 一 个 字 节 
范围 。 这 类 记录 上 锁 几 乎 都 用 作协 作 进 程 之 间 的 劝告 性 锁 ， 因 为 即使 
征 强 制 性 上 锁 也 会 导致 不 一 致 的 数据 ， 正 如 我 们 所 示 。 

使 用 fcntl 记 录 上 锁 时 ， 等 待 着 的 读 出 者 优先 还 是 等 待 着 的 写 入 者 优 
先 没 有 保证 ， 这 也 是 我 们 在 第 8 章 中 看 到 过 的 读 写 锁 的 情形 。 如 有 果 这 对 
于 茶 个 应 用 来 说 很 重要 ， 那 束 编 写 并 运行 9.6 世 中 开发 的 类 似 测试 程 


序 ， 或 者 给 该 应 用 提供 满足 所 需 优先 关系 的 专用 读 写 锁 实现 (如 我 们 
在 8.4 方 所 做 的 那样 。 


习题 


9.1 从 图 9-2 和 图 9-1 构 造 locknone 程 序 ， 在 自己 的 系统 上 运行 多 次 。 
验证 这 个 没有 任何 上 锁 能 力 的 程序 工作 不 正确 ， 而 且 结 果 是 非 确定 
Hy ° 

9.2 把 图 9-2 中 的 程序 修改 成 不 对 标准 输出 进行 缓冲 。 这 样 的 修改 有 
TPZ BRP 

9.3 继续 上 一 道 习 题 ， 这 次 改 为 调用 putchar 逐 个 输出 字符 ， 而 不 是 
调用 printf。 这 样 的 修改 有 什么 效 采 ? 

9.4 把 图 9-3 中 my_lock 函 数 使 用 的 写 入 锁 改 为 读 出 锁 。 会 发 生 什 
A? 

9.5 把 loopmain.c 程 序 中 的 open 调 用 改 为 同时 指定 O_NONBLOCK 标 
志 “。 构 造 loopfcntlnonb 程 序 ， 同 时 运行 它 的 两 个 实例 。 结 果 有 什么 变化 
Jj? 为 什么 ? 

9.6 继续 上 一 道 习 题 ， 这 次 使 用 非 阻塞 版 本 的 loopmain.c 构 造 
loopnonenonb 程 序 〈 使 用 locknone.c 文 件 ， 它 不 进行 上 锁 操 作 ) 。 启 用 
seqno 文 件 的 强制 性 上 锁 。 同 时 运行 本 程序 的 一 个 实例 以 及 来 自 上 一 道 
习题 的 loopfcntinonb 程 序 的 一 个 实例 。 会 发 生 什么 ? 

9.7 构造 loopfcntl 程 序 ， 从 某 个 shell 脚 本 在 后 台 运 行 它 10 次 。 这 10 
个 实例 的 每 一 个 应 指定 一 个 值 为 10 000 的 命令 行 参数 。 首 先 在 使 用 劝告 
性 上 锁 的 前 提 下 给 这 个 shell 脚 本 计时 ， 然 后 把 seqno 文 件 的 权限 改 为 局 
用 强制 性 上 锁 。 强 制 性 上 锁 对 性 能 有 什么 影响 ? 

9.8 在 图 9-8 和 图 9-9 中 ， 我 们 为 什么 调用 fork 创 建 子 进程 ， 而 不 是 调 
用 pthread_create 创 建 线程 ? 


9.9 在 图 9-11 中 ， 我 们 调用 ftruncate 把 文件 的 大 小 置 为 0 字 节 。 为 什 
么 不 改 为 简单 地 给 open 指 定 O_TRUNC 标 志 ? 

9.10 如 果 我 们 要 编写 一 个 使 用 fentl 记 录 上 锁 的 线程 化 应 用 程序 ， 那 
ATETRAE E BAB DEB UR E D fme ERE. NIBSHISEEK SET ^ SEEK, CURI 
是 SEEK_END 呢 ?为 什么 ? 


第 10 章 Posix 信 和 号 量 
10.1 概述 


{8-5 (semaphore) 是 一 种 用 于 提供 不 同 进程 间或 一 个 给 定 进 程 
的 不 同 线程 间 同 步 手 段 的 原 语 。 本 书 讨论 三 种 类 型 的 信号 量 。 

Posix 有 名 信号 量 : 使 用 Posix IPC 名 字 (2.277) 标识 ， 可 用 于 进程 
或 线程 间 的 同步 。 

Posix 基 于 内 存 的 信号 量 : 存放 在 共享 内 存 区 中 ， 可 用 于 进程 或 线 
程 间 的 同步 。 

System V 信 号 量 (第 11 章 ) : 在 内 核 中 维护 ， 可 用 于 进程 或 线程 间 
的 同步 。 

我 们 暂时 只 考虑 不 同 进程 间 的 同步 。 首 先 考 虑 二 值 信 号 量 (binary 
semaphore) : 其 值 或 为 0 或 为 1 的 信号 量 。 图 10-1 展 示 了 这 种 信号 量 。 


进程 A 


创建 、 等 待 和 挂 出 
信号 量 的 函数 


图 10-1 由 两 个 进程 使 用 的 一 个 二 值 信号 量 
图 中 画 出 该 信号 量 是 由 内 核 来 维护 的 〈 这 对 于 System V 信 和 号 量 是 
正确 的 ) ， 其 值 可 以 是 0 或 1。 
Posix 信 和 号 量 不 必 在 内 核 中 维护 。 另 外 ，Posix 信 号 量 是 由 可 能 与 文 
件 系统 中 的 路 径 名 对 应 的 名 字 来 标识 的 。 因 此 ， 图 10-2 是 Posix 有 名 信 
号 量 的 更 为 实际 的 图 示 。 
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创建 、 等 竺 和 挂 出 
信号 量 的 函数 


容 或 为 0 或 为 1 的 文件 
图 10-2 由 两 个 进程 使 用 的 一 个 Posix 有 名 二 值 信号 量 

我 们 必须 束 图 10-2 作 一 个 限定 : 尽管 Posix 有 名 信和 号 量 是 由 可 能 与 
文件 系统 中 的 路 径 对 应 的 名 字 来 标识 的 ， 但 是 并 不 要 求 它们 真正 存放 
在 文件 系统 内 的 某 个 文件 中 。 举 例 来 襄 ， 崩 入 式 实时 系统 可 能 使 用 这 
样 的 名 字 来 标识 信号 量 ， 但 是 真正 的 信号 量 值 却 存放 在 内 核 中 的 某 个 
地 方 。 然 而 ， 如 果 信 号 量 的 实现 用 到 了 映射 文件 (我们 将 在 10.15 市 展 
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示 这 样 的 一 个 实现 ) ， 那 么 信号 量 的 真正 值 确实 出 现在 某 个 文件 中 ， 
而 该 文件 是 映射 到 所 有 让 该 信号 量 打 开 着 的 进程 的 地 址 空间 的 。 

在 图 10-1 和 图 10-2 中 ， 我 们 注 出 了 一 个 进程 可 以 在 某 个 信号 量 上 执 
行 的 三 种 操作 。 

DAE (create) 一 个 信号 量 。 这 还 要 求 调用 者 指定 初始 值 ， 对 于 
二 值 信号 量 来 说 ， 它 通常 是 1， 但 也 可 以 是 0。 

DE (wat) 一 个 信号 量 。 该 操作 会 测试 会 这 个 信号 量 的 值 ， 
如 果 其 值 小 于 或 等 于 0， 那 就 等 待 (阻塞 ) , 一旦 其 值 变 为 大 于 0 就 将 
EWL ° 这 个 过 程 可 以 用 如 下 的 仿 代 码 来 总 结 : 


while (semaphore_value <= 0) 


/* wait; i.e.,block the thread or process */ 

semaphore value--; 

/* we have the semaphore */ 

这 里 的 基本 要 求 是 : 考虑 到 访问 同一 信号 量 的 其 他 线程 或 进程 ， 
在 while 语 句 中 测试 该 信号 量 的 值 和 其 后 将 它 减 1 (如 果 该 值 大 于 0) 这 
两 个 步骤 必须 作为 一 个 原子 操作 完成 。 (这 是 20 世 纪 80 年 代 中 期 
System V 信 和 号 量 在 内 核 中 实现 的 原因 之 一 。 这 样 一 来 信号 量 操 作成 为 
内 核 中 的 系统 调用 ， 于 是 保证 相对 其 他 进程 的 原子 性 变 得 容易 起 
HK e) 

本 操作 还 有 其 他 常用 名 字 : 最 初 Edsger Dijkstra 称 它 为 P 操 作 ， 代 表 
HEA proberen (意思 是 尝试 ) 。 它 也 称 为 递减 (down， 因 为 信号 
量 的 值 被 减 掉 1) 或 上 锁 (lock) ,不 过 我 们 使 用 Posix 术 语 等 待 
(wait) 。 

(3) 挂 出 (pos) 一 个 信号 量 。 该 操作 将 信和 号 量 的 值 加 1， 可 以 用 如 
下 的 伪 代 码 来 总 结 : 


semaphore_value++; 


如 果 有 一 些 进程 阻塞 着 等 待 该 信号 量 的 值 变 为 大 于 0， 其 中 一 个 进 
程 现在 就 可 能 被 唤醒 。 与 刚刚 给 出 的 等 竺 伪 代 码 一 样 ， 考 虑 到 访问 同 
一 信号 量 的 其 他 进程 ， 挂 出 操作 也 必须 是 原子 的 。 

本 操作 还 有 其 他 常用 名 字 : OPA VERE, RE = A 
verhogen (意思 是 增加 ) 。 它 也 称 为 递增 (up， 因 为 信号 量 的 值 被 加 上 
1) `#P (unlock) 或 发 信号 (signal) 。 我 们 使 用 Posix 术 语 挂 出 

(post) 。 

显而易见 ， 真正 的 信号 量 代码 比 我 们 给 出 的 等 每 和 挂 出 操作 的 伪 
代码 有 更 多 的 细节 ， 也 融 是 如 何 将 等 待 某 个 给 定 信号 量 的 所 有 进程 排 
队 ， 然 后 如 何 唤醒 一 个 《可 能 是 很 多 进程 中 的 一 个 ) 正在 等 待 某 个 给 
定 信和 号 量 被 挂 出 的 进程 。 所 入 的 是 这 些 细节 是 由 实现 来 处 理 的 。 

注意 ， 上 面 给 出 的 伪 代 码 并 没有 假定 使 用 其 值 仅 为 0 或 1 的 二 值 信 
号 量 。 它 们 适用 于 其 值 初始 化 为 任意 非 负 值 的 信号 量 。 这 样 的 信号 量 
称 为 计数 信号 量 (counting semaphore) 。 计 数 信 号 量 通 常 初始 化 为 某 
个 值 N， 指 示 可 用 的 资源 〈 璧 如 说 缓冲 区 ) 数 。 本 章 我 们 将 同时 展示 二 
值 信 号 量 和 计数 信号 量 的 例子 。 

我 们 往往 在 二 值 信号 量 和 计数 信号 量 之 间 进 行 区 分 ， 这 样 做 是 为 
了 我 们 自己 的 教导 目的 。 在 实现 信号 量 的 代码 中 ， 这 两 者 间 并 没有 差 
别 。 

二 值 信号 量 可 用 于 互 不 目的 ， 就 像 互 不 锁 一 样 。 图 10-3 给 出 了 一 个 
例子 。 


初始 化 互 斥 锁 ; 初始 化 信号 量 为 1; 
pthread mutex lock(&mutex); sem wait(&sem); 
临界 区 临界 区 
pthread mutex unlock (&mutex) ; sem post(&sem); 


图 10-3 比较 解决 互 不 问题 的 互 不 锁 和 信号 量 


我 们 把 信号 量 初 始 化 为 1，sem_wait 调 用 等 待 其 值 变 为 大 于 0， 然 后 
KHERI, sem PE L a AMA ， 然 后 唤醒 阻塞 在 
sem_wait 调 用 中 等 竺 该 信号 量 的 任何 线程 。 

Se las 信号 量 还 有 一 个 互 不 锁 没 有 提供 的 
特性 : 互 斥 锁 必 须 总 是 由 

222 锁 住 它 的 线程 解锁 ， 信 号 量 的 挂 出 却 不 必 由 执 行 过 它 的 等 待 操 
作 的 同一 线程 执行 。 我们 可 以 使 用 两 个 二 值 信 号 量 和 第 7 章 中 生产 者 - 消 
费 者 问题 的 一 个 简化 版 本 提供 展示 这 种 特性 的 一 个 例子 。 图 10-4 展 示 了 
往 某 个 共享 缓 冲 区 中 放置 一 个 条 目的 一 个 生产 者 以 及 取 走 该 条 目的 一 
个 消费 者 。 为 简 单 起 见 ， 假 设 该 缓冲 区 只 容纳 一 个 条 目 。 


生产 者 消费 者 


图 10-4 使 用 一 个 共享 缓冲 区 的 简单 生产 者 -消费 者 问题 
图 10-5 给 出 了 生产 者 和 消费 者 程序 的 伪 代 码 。 
生产 者 消费 者 


把 信号 量 get 初 始 化 为 0; 
把 信号 量 put 初 始 化 为 1; 


for E | Fo 
sem wait (&put) ; sem wait (&get) ; 
把 数据 放 入 缓冲 区 处 理 缓冲 区 中 的 数据 
sem post (&get) ; sem post (&put) ; 
} } 


图 10-5 简单 的 生产 者 -消费 者 程序 的 伪 代 码 
信号 量 put 控 制 生 产 者 是 否 可 以 往 共享 缓冲 区 中 放置 一 个 条 目 ， 信 
量 get 控 制 消 费 者 是 否 可 以 从 共 至 缓冲 区 中 取 走 一 个 条 目 。 按 时 间 顺 
序 发 生 的 步骤 如 下 所 壕 。 


(1) 生 产 者 初始 化 缓冲 区 和 两 个 信和 号 量 。 

(2) 假 设 消费 者 接着 运行 。 它 阻塞 在 sem_wait 调 用 中 ， 因 为 get 的 值 
为 0。 

(3) 一 段 时 间 后 生产 者 接着 运行 。 当 它 调用 sem_wait 后 ，put 的 值 由 1 
减 为 0， 于 是 生产 者 往 缓冲 区 中 放置 一 个 条 目 ， 然 后 它 调 用 sem_post， 
把 get 的 值 由 0 增 为 1。 既然 有 一 个 线程 ( 即 消费 者 ) 阻塞 在 该 信号 量 上 
等 待 其 值 变 为 正 数 ， 该 线程 将 被 标记 成 准备 好 运行 (ready to run). 。 
但 是 假设 生产 者 继续 和 运行， 生产 者 随后 会 阻塞 在 for 循 环 顶 部 的 
sem_wait 调 用 中 ， 因 为 put 的 值 为 0。 生产 者 必须 等 待 到 消费 者 腾空 缓冲 
区 。 

(4) 消 费 者 从 sem_wait 调 用 中 返回 ， 它 将 get 信 和 号 量 的 值 由 1 减 为 0。 
接着 它 会 处 理 缓冲 区 中 的 数据 ， 然 后 调用 sem_post， 把 put 的 值 由 0 增 为 
1» 既然 有 一 个 线程 (生产 者 ) 阻塞 在 该 信号 量 上 等 待 其 值 变 为 正 数 ， 
该 线程 将 被 标记 成 准备 好 运行 。 但 是 假设 消费 者 继续 运行 ， 消 费 者 随 
后 会 阻塞 在 for 循 环 顶 部 的 sem_wait 调 用 中 ， 因 为 get 的 值 为 0。 

(5) 生 产 者 从 sem_wait 调 用 中 返回 ， 于 是 把 数据 放 入 缓冲 区 中 ， 上 
述 情 形 循 环 继续 o 

我 们 假设 每 次 调用 sem_post 时 ， 即 使 当时 有 一 个 进程 正在 等 竺 并 随 
后 被 标记 成 准备 好 运行 ， 调 用 者 也 继续 运行 。 是 调用 者 继续 运行 还 是 
刚 变 成 准备 好 状态 的 线程 运行 无 关 紧要 (你 应 该 假设 对 立 的 情形 ， 并 
说 服 自己 接受 这 个 事实 ) 。 

下 面 列 出 信号 量 、 互 斥 锁 和 条 件 变量 之 间 的 三 个 差异 。 

( 互 斥 锁 必 须 总 是 由 给 它 上 锁 的 线程 解锁 ， 信 号 量 的 挂 出 却 不 必 
由 执行 过 它 的 等 竺 操作 的 同一 线程 执行 。 这 是 我 们 的 例子 刚 展 示 过 
的 。 


(2) 互 不 锁 要 么 被 锁 住 ， 要 么 被 解 开 (二 值 状态 ， 类 似 于 二 值 信 号 


量 ) 


(3) 既 然 信 号 量 有 一 个 与 之 关联 的 状态 〈 它 的 计数 值 ) ， 那 么 信号 
量 挂 出 操作 总 是 被 记 住 。 然 而 当 向 一 个 条 件 变量 发 送信 号 时 ， 如 果 没 
有 线程 等 待 在 该 条 件 变量 上 ， 那 么 该 信号 将 丢失 。 作 为 这 种 特性 的 一 
个 例子 ， 考 虑 图 10-5， 不 过 假设 第 一 次 通过 生产 者 的 循环 时 ， 消 费 者 还 
没有 调用 sem_wait。 生 产 者 仍 可 以 往 缓冲 区 放置 数据 条 目 ， 然 后 在 get 
信号 量 上 调用 sem_post 〈 把 它 的 值 由 0 增 为 1) ， 接 着 阻塞 在 put 信 号 量 
上 的 sem_wait 调 用 中 。 一 段 时 间 以 后 ， 消 费 者 可 能 进入 它 的 for 人 循环 ， 
在 get 信 号 量 上 调用 sem_wait， 其 结果 是 将 该 信号 量 的 值 减 1 (由 1 减 为 
0) ， 于 是 消费 者 接着 处 理 缓冲 区 。 

Posix.1 基 本 原理 一 文 声称 ， 有 了 互 斥 锁 和 条 件 变 量 还 提供 信和 号 量 
的 原因 是 : “本 标准 提供 信号 量 的 主要 目的 是 提供 一 种 进程 间 同 步 方 
式 。 这 些 进 程 可 能 共享 也 可 能 不 共享 内 存 区 。 互 斥 锁 和 条 件 变量 是 作 
为 线程 间 的 同步 机 制 说 明 的 ， 这 些 线程 总 是 共享 ( 某 个 ) 内 存 区 。 这 
两 者 都 是 已 广泛 使 用 了 多 年 的 同步 范式 。 每 组 原 语 都 特别 适合 于 特定 
的 问题 。 ”我们 将 在 10.15 节 看 到 ， 使 用 互 不 锁 和 条 件 变 量 实现 具有 随 内 
核 持 续 性 的 计数 信号 量 需要 约 300 行 C 代 码 ， 应 用 程序 不 应 该 各 自从 头 
编写 这 300 行 C 代 码 。 尽 管 信 号 量 的 意图 在 于 进程 间 同 步 ， 互 不 锁 和 条 
件 变 量 的 意图 则 在 于 线程 间 同 步 ， 但 是 信号 量 也 可 用 于 线程 间 ， 互 不 
锁 和 条 件 变 量 也 可 用 于 进程 间 。 我 们 应 该 使 用 适合 具体 应 用 的 那 组 原 
语 。 

我 们 提 到 过 Posix 提 供 两 类 信号 量 : 有 名 (named) 信号 量 和 基于 
内 存 的 (memory-based) 的 信号 量 ， 后 者 也 称 为 无 名 (unnamed) 信和 号 
量 。 图 10-6 比 较 了 这 两 类 信和 号 量 使 用 的 函数 。 


有 名 信号 量 基于 内 存 的 信号 量 


sem open() sem init () 


i 


sem wait () 
sem trywait () 
sem post () 
sem getvalue() 


sem close() sem destroy () 
sem unlink() 


图 10-6 用 于 Posix 信 号 量 的 函数 调用 


图 10-2 展 示 了 一 个 Posix 有 名 信号 量 。 图 10-7 则 展示 了 某 个 进程 内 
由 两 个 线程 共享 的 一 个 Posix 基 于 内 存 的 信号 量 。 


图 10-7 由 一 个 进程 内 的 两 个 线程 共享 的 基于 内 存 的 信号 量 

图 10-8 展 示 了 某 个 共享 内 存 区 (第 四 部 分 ) 中 由 两 个 进程 共享 的 一 
个 Posix 基 于 内 存 的 信号 量 。 图 中 画 出 该 共享 内 存 区 同时 属于 这 两 个 进 
程 的 地 址 空间 。 


图 10-8 由 两 个 进程 共享 、 处 于 共享 内 存 区 中 的 基于 内 存 的 信号 量 
本 章 中 我 们 首先 讲述 Posix 有 名 信和 号 量 ， 然 后 讲述 Posix 基 于 内 存 的 
言 写 量 。 我 们 回 到 7.3 市 中 的 生产 者 -消费 者 问题 ， 将 它 扩展 成 允许 多 个 
生产 者 和 一 个 消费 者 ， 最 后 是 多 个 生产 者 和 多 个 消费 者 。 我 们 然后 指 
出 ， 多 个 缓 促 区 的 第 用 WO 技巧 只 是 生产 者 -消费 者 问题 的 一 个 特例 。 
我 们 给 出 Posix 有 名 信号 量 的 三 种 实现 ， 第 一 种 实现 使 用 FIFO， 第 
二 种 实现 使 用 内 存 映 射 TO 以 及 互 斥 锁 和 条 件 变 量 ， 第 三 种 实现 使 用 


o = E. 


System V 信 号 量 。 


10.2 sem open ^ sem close 和 sem_ unlinkER2N 


函数 sem_open 创 建 一 个 新 的 有 名 信和 号 量 或 打开 一 个 已 存在 的 有 名 
号 量 。 有 名 信号 量 总 是 既 可 用 于 线程 间 的 同步 ， 又 可 用 于 进程 间 的 
iba 


#include <semaphore.h> 
sem t *sem open(const char *name,int oflag,... 
/* mode t mode,unsigned int value */ ); 
返回 : 寿 成 功 则 为 指向 信号 量 的 指针 ， 寿 出 错 则 为 
SEM. FAILED 

我 们 已 在 2.2 广 中 搬 述 过 有 关 name 参 数 的 规则 。 

oflag 参 数 可 以 是 0、O_CREAT 或 O CREATIO_EXCL ， 如 2.3 节 所 
述 。 如 果 指 定 了 O_CREAT 标 志 ， 那 么 第 三 个 和 第 四 个 参数 是 需要 的 : 
其 中 mode 参 数 指定 权限 位 (图 2-4) ，value 参 数 指定 信号 量 的 初始 值 。 
该 初始 值 不 能 超过 SEM_VALUFE MAX (这 个 常 值 必 须 至 少 为 
32767) 。 二 值 信号 量 的 初始 值 通常 为 1， 计 数 信号 量 的 初始 值 则 往往 
As 

如 果 指 定 了 O_CREAT (而 没有 指定 O_EXCL) ， 那 么 只 有 当 所 需 
的 信号 量 尚 未 存在 时 才 初 始 化 它 。 不 过 所 需 信 号 量 已 存在 条 件 下 指定 
O_CREAT 并 不 是 一 个 错误 。 该 标志 的 意思 仅仅 是 “如 果 所 需 信 号 量 尚 未 
存在 ， 那 就 创建 并 初始 化 它 ”。 但 是 所 需 信 号 量 已 存在 条 件 下 指定 
O_CREAT IO_EXCL 却 是 一 个 错误 o 

sem_open 的 返回 值 是 指 问 某 个 sem _t 数 据 类 型 的 指针 。 该 指针 随后 
用 作 sem_close、sem wait ^ sem _ trywait、sem_post 以 及 sem_getvalue 的 

用 SEM_FAILED 这 个 返回 值 来 指示 错误 比较 奇怪 。 使 用 空 指针 也 
许 更 为 合理 。 后 来 形成 Posix 标 准 的 那些 早期 草案 指定 使 用 -1 这 个 返回 
值 来 指示 出 错 ， 许 多 实现 于 是 定义 

#define SEM. FAILED ((sem t *)(-1)) 

当 使 用 sem_open 创 建 或 打开 某 个 信号 量 时 ，Posix.1 未 就 与 该 信号 
量 关 联 的 权限 位 做 过 多 少 说 明 。 实 际 上 从 图 2-3 和 前 面 的 讨论 可 注意 
到 ， 当 打开 一 个 有 名 信和 号 量 时 ， 我 们 长 至 没有 在 oflag 参 数 中 指定 


O_RDONLY、O_WRONLY 或 O_RDWR 标志 。 本 书 中 的 例子 所 用 的 两 
个 系统 (Digital Unix 4.0B 和 Solaris 2.6) 都 要 求 对 某 个 已 存在 的 信号 量 
具有 读 访 问 和 写 访问 权限 ， 这 

样 对 它 的 sem_open 才 能 成 功 。 其 原因 也 许 是 信号 量 的 挂 出 与 等 得 
操作 都 需要 读 出 并 修改 信号 量 的 值 。 这 两 种 实现 上 ， qn 
写 访 问 某 个 已 存在 信号 量 的 权限 都 将 导致 sm_open 函 数 返 回 一 
EACCES 错 误 (“Permission denied (访问 权限 不 符 ) ”) 。 

使 用 sem_open 打 开 的 有 名 信和 号 量 ， 使 用 sem_close 将 其 关闭 。 


#include <semaphore.h> 


int sem_close(sem_t *sem); 
返回 : ERIKO, ABA- 
进程 终止 时 ， 内 核 还 对 其 上 仍然 打开 着 的 所 有 有 名 信和 号 量 i 
P a: 闭 操 作 。 不 论 该 进程 是 自愿 终止 的 (通过 调 
exit 或 _exit) 还 是 非 自 愿 地 终止 的 〈 通 过 向 它 发 送 一 个 Unix 信 号 ) , 
种 目 动 天 闭 都 会 发 生 。 

天 闭 一 个 信和 号 量 并 没有 将 它 从 系统 中 删除 。 这 束 是 说 ，Posix 有 名 
信号 量 至 少 是 随 内 核 持续 的 : 即使 当前 没有 进程 打开 着 某 个 信号 量 ， 
它 的 值 仍然 保持 。 

有 名 信号 量 使 用 sem_unlink 从 系统 中 删除 


#include <semaphore.h> 


int sem_unlink(const char *name); 
返回 : 奉 成 功 则 为 0， 奉 出 错 则 为 -1 
每 个 信号 量 有 一 个 引用 计数 器 记录 当前 的 打开 次 数 (就 像 文件 一 
FÉ) ，sem_unlink 类 似 于 文件 VO 的 unlink 函 数 ， 当 引用 计数 还 是 大 于 0 
时 ，name 束 能 从 文件 系统 中 删除 ， 然 而 其 信号 量 的 析 构 (不 同 于 将 它 
的 名 字 从 文件 系统 中 删除 ) 却 要 等 到 最 后 一 个 sem_close 发 生 时 为 止 。 


10.3 sem wait 和 sem trywait 国 数 


sem_wait 芳 数 测 试 所 指定 信号 量 的 值 ， 如 末 该 值 大 于 0， 那 束 将 它 
减 1 并 立即 返回 。 如 果 该 值 等 于 0， 调 用 线程 就 被 投入 睡眠 中 ， 直 到 该 
值 变 为 大 于 0， 这 时 再 将 它 城 1， 男 数 随后 返回 。 我 们 以 前 所 到 过 ， 考 
虑 到 访问 同一 信号 量 的 其 他 线程 ,，“ 测 试 并 减 1” 操 作 必 须 十 原子 的 。 


#include <semaphore.h> 


int sem, wait(sem t *sem); 
int sem trywait(sem t *sem); 
MR: 者 成 功 则 为 0， 乔 出错 则 为 -1 
sem wait 和 sem_trywait 的 差别 是 : 当 所 指定 信号 量 的 值 已 经 是 0 
时 ， 后 者 并 不 将 调用 线程 投入 睡眠 。 相 反 ， 它 返回 一 个 EAGAIN 错 误 。 
如 有 果 被 某 个 信号 中 断 ，sem_wait 就 可 能 过 早 地 返回 ， 所 返回 的 错误 
为 EINTR ° 


10.4 sem post/?ilsem getvalueEk2it 


当 一 个 线程 使 用 完 菜 个 信号 量 时 ， 它 应 该 调用 sem_post。 束 像 10.1 
节 中 讨论 过 的 那样 ， 本 函数 把 所 指定 信号 量 的 值 加 1， 然 后 唤醒 正在 等 
待 该 信号 量 值 变 为 正 数 的 任意 线程 。 


#include <semaphore.h> 


int sem_post(sem_t *sem); 
int sem_getvalue(sem_t *sem,int *valp); 
均 返 回 : ERDUK, ABNA- 
sem_getvalue¢t H valp 4a [al HY 3220 R [u] A TR ze [ei A BME. o 
如 采 该 信号 量 当 前 已 上 锁 ， 那 么 返回 值 或 为 0， 或 为 某 个 负数 ， 其 绝对 
值 殴 是 等 待 该 信号 量 解锁 的 线程 数 。 


我 们 现在 看 到 了 互 斥 锁 、 条 件 变 量 和 信和 号 量 之 间 的 更 多 差别 。 理 
先 ， 互 不 锁 必须 总 是 由 给 它 上 锁 的 线程 解锁 。 信 号 量 没有 这 种 限制 : 
一 个 线程 可 以 等 待 某 个 给 定 信 号 量 ( 壁 如 说 将 该 信号 量 的 值 由 1 减 为 
0， 这 跟 给 该 信号 量 上 锁 一 样 ) ， 而 另 一 个 线程 可 以 挂 出 该 信号 量 CE 
如 说 将 该 信号 量 的 值 由 0 增 为 1， 这 跟 给 该 信号 量 解锁 一 样 ) 。 

其 次 ， 既 然 每 个 信号 量 有 一 个 与 之 关联 的 值 ， 它 由 挂 出 操作 加 1 
等 行 操 作 减 1， 那 么 任何 线程 都 可 以 挂 出 一 个 信号 (譬如 说 将 它 的 值 
由 0 增 为 1) ， 即 使 当时 没有 线程 在 等 待 该 信号 量 值 变 为 正 数 也 没有 关 
系 。 然 而 ， 如 果 某 个 线程 调用 了 pthread_cond_signal， 不 过 当时 没有 任 
何 线程 阻塞 在 pthread_cond_wait 调 用 中 ， 那 么 发 往 相 应 条 件 变量 的 信和 号 
将 丢失 。 

最 后 ， 在 各 种 各 样 的 同步 技巧 〈 互 斥 锁 、 条 件 变 量 、 读 写 锁 、 信 
号 量 ) 中 ， 能 够 从 信和 号 处 理 程序 中 安全 调用 的 唯一 函数 是 sem_post » 

这 三 个 差异 点 不 应 该 被 解释 成 作者 对 于 信号 量 的 仿 租 。 我 们 已 看 
过 的 所 有 同步 原 语 ( 互 不 锁 、 条 件 变 量 、 读 写 锁 、 信 号 量 以 及 记录 上 
锁 ) 都 有 它们 各 自 的 位 置 。 对 于 一 个 给 定 应 用 我 们 已 有 很 多 选择 ， 
而 需要 了 解 各 种 原 语 之 间 的 差别 。 还 要 从 刚刚 列 出 的 比较 中 意识 到 的 
是 ， 互 不 锁 是 为 上 锁 而 优化 的 ， 条 件 变 量 是 为 等 待 而 优化 的 ， 信 和 号 量 
既 可 用 于 上 锁 ， 也 可 用 于 等 待 ， 因 而 可 能 导致 更 多 的 开销 和 更 高 的 复 
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10.5 简单 的 程 


我 们 现在 提供 一 些 在 Posix 有 名 信号 量 上 操作 的 简单 程序 ， 目 的 是 
更 多 地 了 解 它们 的 功能 与 实现 。 由 于 Posix 有 名 信号 量 至 少 具有 随 内 核 
的 持续 性 ， 因 此 我 们 可 以 跨 多 个 程序 操纵 它们 。 

10.5.1 semcreate 程 序 


图 10-9 中 的 程序 创建 一 个 有 名 信和 号 量 ， 人 允许 的 命令 行 选项 有 指定 独 
占 创建 的 -e 和 指定 一 个 初始 值 (默认 值 1 以 外 的 值 ) 的 ji。 


pxse m/semcreate.c 


1 #include "unpipc.h" 


2: ARE 
3 main(int argc, char **argv) 
a 1 


5 int c, flags; 
6 sem t *sem; 
7 unsigned int value; 
8 flags - O RDWR | O CREAT; 
9 value - 1; 
图 10-9 创建 一 个 有 名 信号 量 
10 while ( (c = Getopt(argc, argv, "ei:")) != -1) { 
11 switch (c) ( 
12 case 'e': 
13 flags |= O EXCL; 
14 break; 
15 case 'i': 
16 value - atoi(optarg); 
17 break; 
18 } 
19 
20 if (optind !- argc - 1) 
21 err quit("usage: semcreate [ -e ] [ -i initalvalue ] <name>"); 
22 sem - Sem open(argv[optind], flags, FILE MODE, value); 
23 Sem close (sem); 
24 exit(0); 
25 ) 


pxsem/semcreate.c 


图 10-9 (4E) 


创建 信号 量 

22 既然 总 是 指定 O_CREAT 标 志 ， 我 们 调用 sem_open 时 必须 提供 四 
个 参数 。 不 过 最 后 两 个 参数 只 有 所 需 信 号 量 尚 未 存在 时 才 由 sem_open 
使 用 。 

关闭 信号 量 

23 我 们 调用 sem_close， 不 过 要 是 省 掉 了 这 个 调用 ， 当 相应 进程 终 
止 时 ， 所 创建 的 信号 量 也 被 关闭 (所 占用 的 系统 资源 随 之 释放 ) 。 


10.5.2 semunlink 程 序 
图 10-10 中 的 程序 删除 一 个 有 名 信号 量 的 名 字 。 


pxsem/semunlink.c 


1 #include "unpipc.h" 
2 int 

3 main(int argc, char **argv) 

& 4 

5 if (arge J= 2) 

6 err quit("usage: semunlink <name>"); 
7 Sem unlink (argv[1]) ; 


8 exit(0); 


pxsem/semunlink.c 


图 10-10 删除 一 个 有 名 信和 号 量 的 名 字 


10.5.3 semgetvalue 程 序 

图 10-11 中 的 简单 程序 打开 一 个 有 名 信号 量 ， 取 得 它 的 当前 值 ， 然 
后 输出 该 值 。 

打开 信号 量 

9 当 我 们 去 打开 一 个 一 定 存在 的 信号 量 时 ，sem_open 的 第 二 个 参数 
为 0， 因 为 我 们 不 指定 O_CREAT， 也 没有 其 他 O_xxx 常 值 需 指 定 。 


pxsem/semgetvalue.c 


1 #include "unpipc.h" 


int 

main(int argc, char **argv) 
sem t *sem; 
int val; 


Nu FW ND 


7 if (argc !- 2) 
err quit("usage: semgetvalue <name>"); 


9 sem - Sem open(argv[1], 0); 
10 Sem getvalue(sem, &val); 

14 printf ("value = %d\n", val); 
12 exit (0); 

13 } 


pxsem/semgetvalue.c 


图 10-11 取得 并 输出 一 个 信号 量 的 值 


10.5.4 semwait 程 序 

图 10-12 中 的 程序 打开 一 个 有 名 信号 量 ， 调 用 sem_wait (如 有 果 该 信 
号 量 的 当前 值 小 于 或 等 于 0， 该 调用 束 阻 塞 ， iiie D MN 
量 的 值 减 1) ， 取 得 并 输出 该 信号 量 的 当前 值 ， 然 后 永远 阻塞 在 一 
pause 调 用 中 。 


pxsem/semwait.c 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 1 

5 sem t *sem 

6 int val 

F if (argc: l= ‘2) 

8 err quit("usage: semwait <name>"); 

9 sem - Sem open(argv[1], 0); 

10 Sem wait (sem); 

d Sem getvalue (sem, &val); 

12 printf("pid $1d has semaphore, value = %d\n", (long) getpid(), val); 
13 pause () ; /* blocks until killed */ 
14 exit (0); 

15 } 


pxsem/semwait.c 


图 10-12 等 竺 一 个 信和 号 量 并 输出 它 的 值 
10.5.5 sempost 程 序 


图 10-13 中 的 程序 挂 出 一 个 有 名 信号 量 ( 即 把 它 的 值 加 1) ， 然 后 取 
得 并 输出 该 信号 量 的 值 。 


pxsem/sempost.c 


1 #include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 


5 sem t *sgem; 

6 int val; 

p if (argo l= 2) 

8 err quit("usage: sempost <name>") ; 
9 sem - Sem open(argv[1], 0); 

10 Sem post (sem) ; 

71 Sem getvalue(sem, &val); 

12 printf("value = %d\n", val); 

13 exit (0); 

14 ) 


pxsem/sempost. .C 


10.5.6 例子 

我 们 首先 在 Digital Unix 4.0B 下 创建 一 个 有 名 信和 号 量 ， 然 后 输出 它 
的 (默认) fü 

alpha % semcreate /tmp/test1 

alpha 96 ls -| /tmp/test1 

-IW-I--r-- ] rstevens system 264 Nov 13 08:51 /tmp/test1 
alpha 96 semgetvalue /tmp/test1 


value = 1 


跟 Posix 消 息 队 列 一 样 ， 本 系统 创建 一 人 
UE to sus 

现在 等 待 该 信号 量 ， 然 后 中 止 持 有 该 信号 量 锁 的 程序 。 

alpha 96 semwait /tmp/test1 


pid 9702 has semaphore,value = 0 sem_wait 返 回 后 的 值 

A? 键入 中 断 
键 以 中 止 程序 

value = 0 全 仍然 为 0 


alpha 96 semgetvalue /tmp/test1 


本 例子 展示 了 我 们 早先 提 人 到 过 
随 内 核 持 续 的 。 这 束 古 说 ， 从 上 一 


管 期 间 没有 程序 打开 着 该 信号 量 ， 


次 ， 当 我 们 中 止 持 有 信号 量 锁 的 semwait 程 序 时 ， 


Forte, SHAR MSE 


pie Bt, fas BA ie 
刻 信 号 量 到 本 例子 ， 尽 
SES ME 
该 信号 量 的 值 并 不 改 
BAI A BE RAIL, Al 


核 并 不 给 该 信号 量 解锁 。 这 跟 记录 锁 不 一 样 ， 我 们 在 第 9 章 中 说 过 ， 当 
持 有 某 个 记录 锁 的 进程 没有 释放 它 束 终止 时 ， 内 核 目 动 释放 它 。 


我 们 接着 展示 Digital Unix 的 信号 量 


待 该 信号 量 解 锁 的 进程 数 。 
value = 0 
上 一 个 例子 的 0 
alpha 96 semwait /tmp/test1 & 
semwait 程 序 
[1] 9718 


value = -1 
等 符 信 号 量 
alpha 96 semwait /tmp/test1 & 
semwait 程 序 
alpha 96 semgetvalue /tmp/test1 
alpha 96 semgetvalue /tmp/test1 
[2] 9727 


alpha 96 sempost /tmp/test1 


实现 使 用 负 的 信和 号 量 值 指示 等 


ENAERE 


ERABAT 


ES 


A 


ni 


有 一 个 进程 在 


TEIG B NAT 


它 也 阻塞 ， 


有 两 个 进程 在 


现在 挂 出 信号 量 


value = -1 sem_post 返 回 


后 的 值 


pid 9718 has semaphore,value = -1 来 自 第 一 个 semwait 程 序 
的 输出 

alpha 96 sempost /tmp/test1 再 次 挂 出 信号 量 

pid 9727 has semaphore,value = 0 来 目 第 二 个 semwait 程 
序 的 输出 


alpha 96 semgetvalue /tmp/test1 

value 7 0 

当 信号 量 值 为 -2 时 ， 我 们 执行 Sempost 程 序 ， 于 是 该 值 经 加 1 后 变 为 
-1， 同 时 有 一 个 原本 阻塞 在 sem_wait 调 用 中 的 进程 返回 。 

现在 改 为 在 Solaris 2.6 下 执行 同样 的 例子 ， 目 的 是 查看 它们 在 信号 
量 实现 上 的 差异 。 


solaris 96 semcreate /test2 


solaris 96 ls -l /tmp/.*test2* 

-rw-r--r-- 1 rstevens other1 48 Nov 13 09:11 /tmp/.SEMDtest2 

-IW-TW-IW- 1 rstevens other1 0 Nov 13 09:11 
/tmp/.SEMLtest2 solaris % semgetvalue / test2 

value = 1 

跟 Posix 消 息 队 列 一 样 ，Solaris 系 统 在 /tmp 目 录 下 创建 若干 文件 ， 作 
为 文件 名 后 缀 的 是 所 指定 信号 量 的 名 字 。 我 们 看 到 第 一 个 文件 的 权限 
与 我 们 调用 sem_open 时 指定 的 权限 相对 应 ， 至 于 第 二 个 文件 ， 我 们 儿 
想 其 用 于 上 锁 。 

下 面 验 证 当 挂 有 某 个 信号 量 锁 的 进程 没有 释放 该 锁 束 终止 时 ， 内 
核 没有 目 动 挂 出 该 信号 量 。 


solaris 96 semwait /test2 


pid 4133 has semaphore,value = 0 


A? 键入 中 断 
p: 

value - 0 值 仍然 为 0 
solaris 96 semgetvalue /test2 

接着 展示 Solaris 的 信号 量 实现 在 有 进程 等 待 着 某 个 信和 号 量 的 时 候 如 
何 处 理 该 信号 量 的 值 。 


solaris 96 semgetvalue /test2 


value - 0 值 仍然 是 来 目 
一 个 例子 的 0 

solaris % semwait /test2 & 在 后 人 台 启 动 一 
semwait 程 序 

[1] 4257 EHE, $ 
FATE 

value = 0 本 实现 不 使 用 
负 值 

solaris 96 semwait /test2 & 在 后 台 局 动 邑 一 个 
semwait 程 序 

value = 0 (8 4525750, 
不 过 有 两 个 进程 在 等 着 

solaris 96 sempost /test2 现在 挂 出 信号 量 

pid 4257 has semaphore,value = 0 来 目 第 一 个 semwait 程 
序 的 输出 

pid 4263 has semaphore,value = 0 来 目 第 二 个 semwait 程 
序 的 输出 solaris % semgetvalue /test2 

[2] 4263 


solaris 96 semgetvalue /test2 


value = 0 


solaris 96 sempost /test2 

value 7 0 

与 前 面 在 Digital Unix 下 的 输出 相 比 ， 这 个 输出 中 的 一 个 差别 是 在 
挂 出 信号 量 的 时 机 : 看 起 来 等 待 着 的 进程 优 于 挂 出 信号 量 的 进程 运 
ce 


10.6 生产 者 一 消 问题 


我 们 在 7.3 节 中 讲述 了 生产 者 -消费 者 问题 ， 并 展示 了 一 些 解 决 方 
案 ， 具 体 解 决 多 个 生产 者 线程 填写 由 单个 消费 者 线程 处 理 的 一 个 数组 
时 的 同步 问题 。 

(在 第 一 个 方案 中 (7.3 节 ) ， 消 费 者 是 在 生产 者 完成 后 启动 的 ， 
因此 使 用 单个 互 斥 锁 (来 同步 各 个 生产 者 ) 就 能 解决 同步 问题 。 

(2) 在 下 一 个 方案 中 (7.57) ， 消 费 者 在 生产 者 完成 之 前 启动 ， 因 
此 解决 同步 问题 需要 一 个 互 斥 锁 (来 同步 各 个 生产 者 ) 加 上 一 个 条 件 
变量 及 其 互 斥 锁 (来 同步 生产 者 和 消费 者 ) ° 

现在 对 生产 者 -消费 者 问题 进行 扩展 ， 把 共享 缓冲 区 用 作 一 个 环绕 
缓冲 区 : 生产 者 填写 最 后 一 项 (buff[NBUFF-1]) 后 ， 回 过 头 来 填写 第 
一 项 (buff[0]) ， 消 费 者 也 同样 这 么 做 。 这 么 一 来 增加 了 又 一 个 同步 问 
题 ， 即 生产 者 不 能 走 到 消费 者 的 前 面 。 我 们 仍然 假设 生产 者 和 消费 者 
都 是 线程 ， 不 过 它们 也 可 以 是 进程 ， 前 提 是 存在 某 种 在 进程 间 共 享 绥 
冲 区 的 方法 (例如 我 们 将 在 第 四 部 分 介绍 的 共享 内 存 区 ) 。 

当 共 享 缓冲 区 作为 一 个 环绕 缓冲 区 考虑 时 ， 必 须 由 代码 来 维持 以 
下 三 个 条 件 。 

(1) 当 缓冲 区 为 空 时 ， 消 费 者 不 能 试图 从 其 中 去 除 一 个 条 目 。 

(2) 当 缓冲 区 填 满 时 ， 生 产 者 不 能 试图 往 其 中 放置 一 个 条 目 。 


(3) 共 享 变量 可 能 描述 缓冲 区 的 当前 状态 (下 标 、 计 数 和 链表 指针 
等 ) ， 因 此 生产 者 和 消费 者 的 所 有 缓冲 区 操纵 都 必须 保护 起 来 ， 以 避 
US EL AS 

接 下 来 我 们 给 出 的 使 用 信和 号 量 的 方案 展示 了 三 种 不 同类 型 的 信和 号 


nce 值 信号 量 保护 两 个 临界 区 : 一 个 是 往 共 享 缓冲 区 
中 插入 一 个 数据 条 目 (由 生产 者 执行 ) ， 另 一 个 是 从 共享 缓冲 区 中 移 
走 一 个 数据 条 目 (由 消费 者 执行 ) 。 用 作 互 斥 锁 的 二 值 信号 量 初始 i 
为 1。 (显然 ， 我 们 可 以 使 用 真正 的 互 斥 锁 代 殖 这 样 的 二 值 信号 量 。 
习题 10.10。) ” (2) 名 为 nempty 的 计数 信号 量 统计 共享 缓冲 区 中 的 空 PN 
数 。 该 信号 量 初始 化 为 缓冲 区 中 的 槽 位 数 (NBUFF) 。 

(3) 名 为 nstored 的 计数 信号 量 统计 共享 缓冲 区 中 已 填写 的 槽 位 数 。 
该 信号 量 初 始 化 为 0， 因 为 缓冲 区 一 开始 是 空 的 。 

图 10-14 展 示 了 程序 完成 初始 化 时 我 们 的 缓冲 区 及 两 个 计数 信号 量 
的 状态 。 我 们 给 未 用 的 数组 元 素 标 以 阴影 。 


buff [0] : 
ERLI 
buff [2] : 
Bure [3]: 


buff [NBUFF-1] : 


nempty: NBUFF: 


图 10-14 初始 化 后 的 缓冲 区 和 两 个 计数 信号 量 
在 我 们 的 例子 中 ， 生 产 者 只 是 把 0~-(NLOOP-TD) 存 放 到 共享 缓冲 区 
中 (buff[0] = 0，buff[1]= 1， 等 等 ) ， 并 把 该 缓冲 区 用 作 一 个 环绕 缓冲 
区 。 消 费 者 从 该 缓冲 区 取出 这 些 整数 ， 并 验证 它们 是 正确 的 ， 若 有 错 
误 则 输出 到 标准 输出 上 。 
图 10-15 展 示 了 在 生产 者 往 共 享 缓冲 区 放置 了 3 个 条 目 之 后 ， 但 在 消 
息 者 从 该 缓冲 区 取 走 其 中 任何 条 目 之 前 该 缓冲 区 和 两 个 计数 信号 量 的 
状态 。 


——» buff [0] : 


生产 者 放置 3 个 —ø buff[l]: 
条 目 到 缓冲 区 中 
buff [2] : 


butt [3] : 


buff [NBUFF-1] : 


nempty: 


nstored: 


图 10-15 生产 者 放置 3 个 条 目 到 缓冲 区 后 的 缓冲 区 和 计数 信号 量 


我 们 接着 假设 消费 者 从 共享 绥 冲 区 中 移 走 一 个 条 目 ， 图 10-16 展 示 
这 时 的 状态 。 


buff [0] : — 消费 者 从 缓冲 区 


buff [1] : 移 走 1 个 条 目 
buff [2] : 


buff [3] : 


buff [NBUFF-1] : 


nempty : 


nstored: 


图 10-16 消费 者 从 缓冲 区 移 走 第 一 个 条 目 后 的 缓冲 区 和 计数 信号 量 


图 10-17 中 的 main 函 数 创 建 前 述 三 个 信号 量 ， 创 建 两 个 线程 ， 
这 两 个 线程 的 完成 ， 然 后 删除 这 些 信 号 量 。 

全 局 变量 

67-10 可 存放 NBUFF 个 条 目的 缓冲 区 以 及 三 个 信号 量 指针 是 生产 
者 线程 和 消费 者 线程 共享 的 全 局 变量 。 正 如 第 7 章 中 所 述 ， 我 们 把 它们 
收集 到 一 个 结构 中 ， 以 强调 这 些 信 号 量 是 用 于 同步 对 共享 缓冲 区 的 访 
问 的 。 

创建 信号 量 

19--25 创建 三 个 信号 量 ， 它 们 的 名 字 首 先 传 递 给 我 们 的 
px_ipc_name 夯 数 。 指 定 O_EXCL 标 志 ， 因 为 每 个 信号 量 都 需要 初始 化 
为 正确 的 值 。 如 果 这 三 个 信号 量 因 先前 本 程序 运行 中 止 而 没有 全 部 删 


除 ， 那 么 我 们 可 以 在 创建 之 前 给 每 个 信号 量 调用 sem_unlink， 并 忽略 任 
何 错误 。 另 一 种 方法 是 ， 检 查 指 定 了 O_EXCL 标 志 的 sem_open 是 否 返 
[| — Ô EEXIST fa V& , Æ zæ J Yel Fd sem, unlink, 然后 再 调用 一 次 
sem open, AiTIKA—- KM S ETT o UAR AWARE HUS 
一 个 副本 在 运行 (这 一 步 可 在 尝试 创 建 任何 信号 量 之 前 完成 ) ， 那 么 
可 以 如 9.7 节 中 所 述 的 那样 去 做 。 


pxsem/prodcons l.c 


1 #include "unpipc.h" 

2 #define NBUFF 10 

3 #define SEM MUTEX "mutex" /* these are args to px ipc name() */ 
4 #define SEM NEMPTY  "nempty" 

5 #define SEM NSTORED "nstored" 

6 int nitems; /* read-only by producer and consumer */ 
7 struct { /* data shared by producer and consumer */ 
8 int buff [NBUFF] ; 

g sem t *mutex, *nempty, *nstored; 

10 ) shared; 

11 void *produce (void *), *consume(void *); 

12 int 

13 main(int argc, char **argv) 

14 { 

15 pthread t tid produce, tid consume; 

16 if (argc != 2) 

17 err quit("usage: prodconsl <#items>") ; 

18 nitems = atoi (argv[11); 

19 /* create three semaphores */ 

20 Shared.mutex - Sem open(Px ipc name(SEM MUTEX), O CREAT | O EXCL, 
21 FILE MODE, 1); 

22 Shared.nempty - Sem open(Px ipc name(SEM NEMPTY), O CREAT | O EXCL, 
23 FILE MODE, NBUFF); 

24 Shared.nstored - Sem open(Px ipc name(SEM NSTORED), O CREAT | O EXCL, 
25 FILE MODE, 0); 

26 /* create one producer thread and one consumer thread */ 

27 Set concurrency (2); 

28 Pthread create(&tid produce, NULL, produce, NULL); 

29 Pthread create(&tid consume, NULL, consume, NULL); 

30 /* wait for the two threads */ 

31 Pthread join(tid produce, NULL); 

32 Pthread join(tid consume, NULL); 

33 /* remove the semaphores */ 

34 Sem unlink(Px ipc name(SEM MUTEX)); 

35 Sem unlink(Px ipc name(SEM NEMPTY)); 

36 Sem unlink(Px ipc name(SEM NSTORED)); 

37 exit (0); 

38 ) 


创建 两 个 线程 
26~29 创建 两 个 线程 ， 
这 两 个 线程 传递 任何 参数 。 


—^MEAI , 


pxsem/prodcons l.c 


110-17 生产 者 一 消费 者 问题 信号 量 解 决 方案 的 main 函 数 


一 个 作为 消费 着 。 不 给 


30~36 主线 程 然后 等 繁 这 两 个 线程 的 终止 ， 接 着 删除 一 开始 创建 


ERES T H 号 量 


我 们 还 可 以 给 每 个 线程 调用 sem_close， 不 过 进程 终止 时 这 会 目 动 
发 生 。 然 而 删除 一 个 有 名 信和 号 量 的 名 字 却 必须 显 式 地 完成 。 


10-1825 Hi T produce#llcomsume EH ži » 


pxsem/prodcons l.c 


39 void * 

40 produce(void *arg) 

41 ( 

42 int i; 

43 for (i = 0; i « nitems; i++) { 

44 Sem wait (shared.nempty) ; /* wait for at least 1 empty slot */ 
45 Sem wait (shared.mutex) ; 

46 shared.buff[i % NBUFF] = i; /* store i into circular buffer */ 
47 Sem_post (shared.mutex) ; 

48 Sem_post (shared.nstored) ; /* 1 more stored item */ 

49 } 

50 return (NULL) ; 

51 } 

52 void * 

53 consume (void *arg) 

54 ( 

55 int i; 

56 for (i = 0; i « nitems; i++) { 

57 Sem wait (shared.nstored) ; /* wait for at least 1 stored item */ 
58 Sem wait (shared.mutex); 

59 if (shared.buff[i $ NBUFF] !- i) 

60 printf ("buff [%d] = %d\n", i, shared.buff[i % NBUFF]); 

61 Sem post (shared.mutex) ; 

62 Sem_post (shared.nempty) ; /* 1 more empty slot */ 

63 } 

64 return (NULL) ; 

65 } 


pxsem/prodcons 1.c 


图 10-18 produce#ll consume kX Zi 


生产 者 等 竺 到 缓冲 区 中 有 一 个 条 目的 空间 


44 生产 者 在 nempty 信 号 量 上 调用 sem_wait， 等 待 


男 一 个 条 目的 可 用 空间 为 止 。 首 次 执行 本 行 语 句 时 ， 
从 NBUFF 变 为 NBUFF-1。 
生产 者 在 缓冲 区 中 存放 条 目 


Và 冲 区 中 有 存放 
该 信号 量 的 值 将 


45--48 在 往 缓 冲 区 中 存放 新 条 目 之 前 ， 生 产 者 必须 获取 mutex 信 和 号 
量 。 在 我 们 的 例 于 中 ， 生 产 痢 只 是 往 下 标 为 1i% NBUFF 的 数组 元 素 中 存 


放 一 个 值 ， 因 此 不 需要 描述 缓冲 区 状态 的 共享 变量 


(也 就 是 说 我 们 不 


使 用 每 次 往 缓冲 区 中 放置 一 个 条 目 就 得 更 新 状态 的 链表 ) 。 这 样 的 
话 ， 获 取 和 释放 mnutex 信 和 号 量 实际 上 没有 必要 。 不 过 我 们 还 是 给 出 了 ， 
因为 这 种 类 型 的 问题 (更 新 由 多 个 线程 共享 的 一 个 缓冲 区 ) 通常 需要 
X Z flit ° 

往 缓 冲 区 中 存放 当前 条 目 后 ， 释 放 mutex 信 号 量 (其 值 由 0 变 为 
1) ， 并 挂 出 nstored 信 号 量 。 第 一 次 执行 这 个 语句 时 ，nstored 的 值 将 从 
初始 值 0 变 为 1。 

消费 者 等 待 nstored 信 和 号 量 

57--62 当 nstored 信 号 量 的 值 大 于 0 时 ， 绥 冲 区 中 已 有 那么 多 的 条 目 
每 处 理 。 消 费 者 从 绥 冲 区 

死 锁 中 取出 一 个 条 目 并 验证 它 的 值 是 正确 的 ， 不 过 这 样 的 缓冲 区 
访问 是 用 mutex 信 号 量 保 护 起 来 的 。 之 后 消费 者 挂 出 nempty 信 号 量 ， 告 
诉 生产 者 义 有 一 个 空 槽 位 可 用 了 。 

QAR BC TER EROS ER Y TH PER C (图 10-18) 中 两 个 Sem_wait 调 
用 的 顺序 ， 那 会 发 生 什 么 呢 ? 假设 生产 者 首先 启动 〈 跟 习题 10.1 的 解答 
中 所 假设 的 一 样 ) ， 那 么 它 将 往 缓冲 区 中 存放 NBUFF 个 条 目 ， 从 而 把 
nempty 信 与 量 的 值 从 NBUFF 递 减 为 0， 把 nstored 信 号 量 的 值 从 0 递增 为 
NBUFF。 至 此 ， 生 产 者 阻塞 在 Sem_wait(shared.nempty) 调 用 中 ， 因 为 组 
冲 区 满 ， 其 上 没有 存放 另 一 个 条 目的 空 槽 位 可 用 。 

消费 者 局 动 ， 验 证 缓 神 区 中 第 一 批 NBUFF 个 条 目的 正确 性 。 这 个 
过 程 把 nstored 信 号 量 的 值 从 NBUFEF 递 减 为 0， 把 nempty 信 号 量 的 值 从 0 
递增 为 NBUFF。 消 费 考 接着 在 调用 Sem_wait (shared.mutex) Z. Jr DH 3& 4E 
Sem_wait(shared.nstored) 调 用 中 。 生 产 者 可 以 恢复 执行 了 ， 因 为 nempty 
的 值 现 已 大 于 0， 然 而 生产 者 接着 调用 的 是 Seam_wait(shared.mutex)， 于 
AE [H SE o 

这 种 现象 瓯 是 死 锁 (deadlock) 。 生 产 者 在 等 待 mutex 信 和 号 量 ， 但 
是 消费 者 却 持 有 该 信号 量 并 在 等 待 nstored 信 号 量 。 然 而 生产 者 只 有 获 


取 了 mutex 信 号 量 才能 挂 出 nstored 信 号 量 。 这 就 是 使 用 信和 号 量 的 问题 之 
一 : 要 是 编写 代码 时 出 了 差错 ， 程 序 就 不 能 正确 工作 。 

Posix 人 允许 sem_wait 检 测 死 锁 并 返回 EDEADLK 错 误 ， 但 是 运行 本 例 
子 所 用 的 系统 (Solaris 2.6 和 Digital Unix 4.0B) 都 不 能 检测 这 种 错误 。 


10.7 文件 上 锁 


现在 回 到 第 9 章 中 的 序列 号 问题 ， 我 们 提供 了 使 用 Posix 有 名 信号 量 
实现 的 my_lock 和 my_unlock 函 数 。 图 10-19 给 出 了 这 两 个 函数 。 


lock/lockpxsem.c 


1 #include "unpipc.h" 


2 #define LOCK PATH "pxsemlock" 


3 sem t *locksem; 
4 int initflag; 
5 void 


6 my lock(int fd) 


7 { 


8 if (initflag == 0) { 
9 locksem = Sem open(Px ipc name(LOCK PATH), O CREAT, FILE MODE, 1); 
10 initflag - 1; 

11 ) 

12 Sem wait (locksem) ; 
13 3 

14 void 

15 my unlock(int fd) 

16 ( 

17 Sem post (locksem) ; 
18 } 


lock/lockpxsem.c 


图 10-19 使 用 Posix 有 名 信和 号 量 的 文件 上 锁 

这 两 个 函数 采用 一 个 作为 劝 旨 性 文件 锁 使 用 的 信和 号 量 ， 当 首先 调 
用 my_lock 函 数 时 ， 该 信号 量 的 值 和 被 初始 化 为 1。 为 获取 该 文件 锁 ， 我 
们 调用 sem_wait;， 为 释放 该 锁 ， 我 们 调用 sem_post 。 


10.8 sem initfllsem destroy HA 


CUM UE m RS esa EREH — IS 
nameZ XEM, "EB Ta CITE ZAR St P BUR TT OCT © PATO Posix th fe HE 
基于 内 存 的 信号 量 ， 它 们 由 应 用 程序 分 配 信号 量 的 内 存 空间 (也 就 是 
分 配 一 个 sem_t 数 据 类 型 的 内 存 空间 ) ， 然 后 由 系统 初始 化 它们 的 值 。 


#include <semaphore.h> 


int sem_init(sem_t *sem,int shared,unsigned int value); 
返回 : 者 出 销 则 为 -1 
int sem_destroy(sem_t *sem); 
返回 : 大成 功 则 为 0， 大 出 错 则 为 -1 

基于 内 存 的 信号 量 是 由 sem_init 初 始 化 的 。sem 参 数 指 向 应 用 程序 
人 { 变 量 。 如 采 shared 为 0， 那 么 竺 初始 化 的 信号 量 是 在 同 

进程 的 各 个 线程 间 共 享 的 ， 否 则 该 信和 号 量 是 在 进程 间 共 享 的 。 当 
shared 为 非 零 时 ， 该 信号 量 必须 存放 在 某 种 类 型 的 共享 内 存 区 中 ， 而 即 
将 使 用 它 的 所 有 进程 都 要 能 访问 该 共享 内 存 区 。 跟 sem_open 一 样 ， 
value 参 数 是 该 信号 量 的 初始 值 。 

使 用 完 一 个 基于 内 存 的 信号 量 后 ， 我 们 调用 sem_destroy 拱 毁 它 。 

sem open 不 需要 类 似 于 shared 的 参数 或 类 似 于 
PTHREAD_PROCESS_SHARED 的 属性 (第 7 章 中 讲述 的 互 不 锁 和 条 件 
变量 可 使 用 该 属性 ) ， 因 为 有 名 信号 量 总 是 可 以 在 不 同 进程 间 共 享 
Hy ° 

注意 ， 基 于 内 存 的 信号 量 不 使 用 任何 类 似 于 O_CREAT 标 志 的 东 
西 ， 也 就 是 说 ，sem _init 总 是 初始 化 信号 量 的 值 。 因 此 ， 对 于 一 个 给 定 
的 信号 量 ， 我 们 必须 小 心 保证 只 调用 sem _init 一 次 。 (习题 10.2 展 示 了 
对 于 有 名 信号 量 的 这 个 差别 。) 对 一 个 已 初始 化 过 的 信号 量 调用 
sem_init， 其 结果 是 未 定义 的 。 

你 得 确保 理解 sm_open 和 sem_init 之 间 的 下 述 基本 差异 。 前 者 返回 
一 个 指向 某 个 sem_t 变 量 的 指针 ， 该 变量 由 (sem open) RAMA SAC 


并 初始 化 。 后 者 的 第 一 个 参数 是 一 个 指向 某 个 sem_t 变 量 的 指 和 针 ， 该 变 
量 由 调用 者 分 配 ， 然 后 由 (sem ini) 函数 初始 化 。 

Posix.1 和 警告 说 ， 对 于 一 个 基于 内 存 的 信号 量 ， 只 有 sem_init 的 sem 
参数 指 回 的 位 置 可 用 于 访问 该 信号 量 ， 使 用 它 的 sem_t 数 据 类 型 副本 访 
问 时 结果 未 定义 。 

sem_init 出 错时 返回 -1， 但 成 功 时 并 不 返回 0。 这 确实 有 些 奇 怪 ， 
Posix.1 基 本 原理 一 文中 有 一 个 注解 说 ， 将 来 的 菜 个 修订 版 可 能 指定 调 
用 成 功 时 返回 0。 

当 不 需要 使 用 与 有 名 信号 量 关 联 的 名 字 时 ， 可 改 用 基于 内 存 的 信 
量 。 彼 此 无 亲缘 关系 的 不 同 进程 需 使 用 信和 号 量 时 ， 通 种 使 用 有 名 信 
量 。 其 名 字 就 是 各 个 进程 标识 信号 量 的 手段 。 

我 们 在 图 1-3 中 说 过 ， 基 于 内 存 的 信号 量 至 少 具有 随 进程 的 持续 
性 ， 然 而 它们 真正 的 持续 性 却 取决 于 存放 信号 量 的 内 存 区 的 类 型 。 只 
要 含有 某 个 基于 内 存 信 号 量 的 内 存 区 保持 有 效 ， 该 信号 量 束 一 直 存 
在 o 

如 果菜 个 基于 内 存 的 信号 量 是 由 单个 进程 内 的 各 个 线程 共享 的 

(sem_init 的 shared 的 参数 为 0;” ， 那 么 该 信号 量具 有 随 进 程 的 持续 性 ， 
当 该 进程 终止 时 它 也 消失 。 

如 果 某 个 基于 内 存 的 信号 量 是 在 不 同 进程 间 共 享 的 (sem_init 的 
shared 参 数 为 1) ， 那 么 该 信号 量 必须 存放 在 共享 内 存 区 中 ， 因 而 只 
该 共享 内 存 区 仍然 存在 ， 该 信号 量 也 就 继续 存在 。 从 图 1-3 可 以 看 出 ， 
Posix 共 享 内 存 区 和 System V 共 享 内 存 区 都 具有 随 内 核 的 持续 性 。 这 意 
味 着 服务 器 可 以 创建 一 个 共享 内 存 区 ， 在 该 共享 内 存 区 中 初始 化 一 个 
Posix 基 于 内 存 的 信号 量 ， 然 后 终止 。 一 段 时 间 后 ， 一 个 或 多 个 客户 可 
打开 该 共享 内 存 区 ， 访 问 存放 在 其 中 的 基于 内 存 的 信号 量 。 

小 心 ， 下 面 的 代码 并 不 像 预期 的 那样 工作 。 


sem t mysem; 


号 
号 


Sem init(&mysem, 1,0); /* 2nd arg of 1 -» shared between 
processes */ 
if (Fork()== 0){ /* child */ 


Sem_post(&mysem); 
} 
Sem_wait(&mysem); /* parent; wait for child */ 
问题 在 于 信号 量 mysem 不 在 共享 内 存 区 中 ， 正 确 的 代码 见 10.12 
节 。fork 出 来 的 子 进程 通常 不 共享 父 进 程 的 内 存 空 间 。 子 进程 是 在 父 进 
程 内 存 空间 的 副本 上 启动 的 ， 它 跟 共 于 内存 区 不 十 一 回 事 。 我 们 将 在 
本 书 第 四 部 分 详细 讨论 共享 内 存 区 。 
例子 
作为 一 个 例子 ， 我 们 把 图 10-17 和 图 10-18 中 的 生产 者 -消费 者 例子 
程序 转换 成 使 用 基于 内 存 的 信号 量 。 图 10-20 给 出 了 这 个 程序 。 


pxsem/prodcons2.c 
1 #include "unpipc.h" 


2 #define NBUFF 10 


3 int nitems; /* read-only by producer and consumer */ 
4 struct ( /* data shared by producer and consumer */ 
5 int buff [NBUFF] ; 

6 sem t mutex, nempty, nstored; /* semaphores, not pointers */ 
7 ) shared; 

8 void *produce (void *), *consume(void *); 

9 int 
10 main(int argc, char **argv) 
11. { 

12 pthread t tid produce, tid consume; 

13 if (argc != 2) 
14 err quit("usage: prodcons2 <#items>") ; 

15 nitems = atoi(argv[1]); 

16 /* initialize three semaphores */ 

17 Sem init(&shared.mutex, 0, 1); 

18 Sem init(&shared.nempty, 0, NBUFF); 

19 Sem init(&shared.nstored, 0, 0); 

20 Set concurrency (2); 
21 Pthread create(&tid produce, NULL, produce, NULL); 
22 Pthread create(&tid consume, NULL, consume, NULL); 
23 Pthread join(tid produce, NULL); 
24 Pthread join(tid consume, NULL); 


110-20 使 用 基于 内 存 信号 量 的 生产 者 一 消费 者 程序 


y 


55 


) 


Sem destroy (&shared.mutex) ; 
Sem destroy (&shared.nempty); 
Sem destroy (&shared.nstored) ; 


exit (0); 


void * 
produce (void *arg) 


{ 


} 


int 35 


for (i = 0; i < nitems; i++) { 
Sem_wait (&shared.nempty) ; /* wait for at least 1 empty slot */ 
Sem_wait (&shared.mutex) ; 


shared. buff [i 


Q 


5 


NBUFF] = i; /* store i into circular buffer */ 


Sem post (&shared.mutex) ; 
Sem_post (&shared.nstored) ; /* 1 more stored item */ 


) 


return (NULL); 


void * 
consume (void *arg) 


{ 


int i; 


for (i = 0; i « nitems; i++) { 
Sem wait (&shared.nstored) ; /* wait for at least 1 stored item */ 
Sem wait (&shared.mutex) ; 
if (shared.buff[i % NBUFF] !- i) 
printf("buff[$d] = %d\n", i, shared.buff[i $ NBUFF]); 
Sem post (&shared.mutex); 
Sem post (&shared.nempty) ; /* 1 more empty slot */ 


) 


return (NULL); 


Ev 


分 配 信和 号 量 
6 本 程序 所 用 的 三 个 信号 量 现在 声明 为 三 个 sem_t 数 据 类 型 的 变 
而 不 是 以 前 的 三 个 sem_t 数 据 类 型 指针 。 

调用 sem_init 
16~27 把 原来 的 sem_open 调 用 改 为 sem_init，sem_unlink 调 用 改 为 
sem_destroy。 这 几 个 sem_destroy 调 用 实际 上 没有 必要 ， 因 为 程序 马上 
WERT ° 


pxsem/prodcons2.c 


图 10-20 (A) 


其 余 变 动 是 在 所 有 的 sem_wait 和 sem_post 调 用 中 传递 指向 三 个 信号 
量变 量 的 指针 。 


个 生产 


10.6 节 中 的 生产 者 -消费 者 方案 解决 的 是 经 典 的 单个 生产 者 单个 消 
费 者 问题 。 对 它 作 修改 后 允许 有 多 个 生产 者 和 单个 消费 者 。 我 们 从 图 
10-20 使 用 基于 内 存 信号 量 的 方案 着 手 。 图 10-21 给 出 了 全 局 变量 和 main 
Bi o 


pxsem/prodcons3.c 


1 #include "unpipc.h" 

2 #define NBUFF 10 

3 #define MAXNTHREADS 100 

4 int nitems, nproducers; /* read-only by producer and consumer */ 

5 struct ( /* data shared by producers and consumer */ 
6 int buff [NBUFF] ; 

7 int nput; 

8 int nputval; 

9 sem t mutex, nempty, nstored; /* semaphores, not pointers */ 

10 ) shared; 


11 void *produce (void *), *consume(void *); 


12 int 

13 main(int argc, char **argv) 

14 ( 

15 int i, count [MAXNTHREADS] ; 

16 pthread t tid produce [MAXNTHREADS], tid consume; 
17 if (arge !- 3) 

18 err quit("usage: prodcons3 <#items> <#producers>") ; 
19 nitems = atoi(argv[1]); 

20 nproducers = min(atoi(argv[2]), MAXNTHREADS) ; 

21 /* initialize three semaphores */ 

22 Sem init(&shared.mutex, 0, 1); 

23 Sem init(&shared.nempty, 0, NBUFF); 

24 Sem init(&shared.nstored, 0, 0); 

25 /* create all producers and one consumer */ 
26 Set concurrency (nproducers + 1); 

27 for (i = 0; i « nproducers; i++) { 

28 count [i] = 0; 

29 Pthread create(&tid produce[i], NULL, produce, &count [i] ) 
30 } 

31 Pthread create(&tid consume, NULL, consume, NULL) ; 
32 /* wait for all producers and the consumer */ 
33 for (i = 0; i « nproducers; i++) ( 

34 Pthread_join(tid_produce [i], NULL); 

35 printf ("count [$d] = $dWMn", i, count[i]); 

36 } 

37 Pthread_join(tid_consume, NULL) ; 

38 Sem destroy (&shared.mutex) ; 

39 Sem destroy (&shared.nempty) ; 

40 Sem_destroy (&shared.nstored) ; 

41 exit (0); 

42 } 
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全 局 变量 


4 全 局 变量 nitems 是 所 有 生产 者 生产 的 总 条 目 数 ，nproducers 是 生产 
者 线程 的 总 数 。 

它们 都 是 根据 命令 行 参数 设置 的 。 

共享 的 结构 

5--10 在 shared 结 构 中 定义 了 两 个 新 变量 : nputfünputval ° nputzé 
下 一 个 待 存 入 值 的 缓冲 区 项 的 下 标 〈 按 NBUFF 求 模 ) ，nputval 则 是 下 
一 个 签 存 入 绥 冲 区 的 值 。 这 两 个 变量 来 自 图 7-2 和 图 7-3 中 的 解决 方案 。 
它们 用 于 同步 多 个 生产 者 线程 。 

新 的 命令 行 参 数 

17~20 两 个 新 的 命令 行 参 数 分 别 指定 竺 存 人 缓冲 区 的 总 条 目 数 以 
及 待 创建 生产 者 线程 的 总 数 。 

创建 所 有 线程 

21~41 初始 化 各 个 信号 量 ， 创 建 所 有 的 生产 者 线程 和 唯一 的 消费 
者 线程 。 然 后 等 每 所 有 线程 终止 。 这 段 代 码 与 图 7-2 几 乎 相同 。 

图 10-22 给 出 了 由 每 个 生产 者 线程 执行 的 produce 范 数 。 


党 
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43 void * 

44 produce(void *arg) 

45 ( 

46 For ( y $ }) { 

47 Sem_wait (&shared.nempty) ; /* wait for at least 1 empty slot */ 
48 Sem_wait (&shared.mutex) ; 

49 if (shared.nput >= nitems) { 

50 Sem post (&shared.nempty) ; 

51 Sem_post (&shared.mutex) ; 

52 return (NULL) ; /* all done */ 

53 } 

54 shared.buff [shared.nput % NBUFF] = shared.nputval; 

55 shared.nput++; 

56 shared.nputval++; 

57 Sem post (&shared. mutex) ; 

58 Sem_post (&shared.nstored) ; /* 1 more stored item */ 
59 *((int *) arg) += 1; 

60 } 

61 } 
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10-22 所 有 生产 者 线程 都 执行 的 函数 


生产 者 线程 间 的 互 斥 

49--53 与 图 10-18 相 比 的 改变 是 ， 当 所 有 线程 总 共 往 缓冲 区 中 放置 
了 nitems 个 值 后 ， 循 环 即 终止 。 注 意 ， 能 同时 获取 nempty 信 号 量 的 生产 
者 线程 可 能 有 多 个 ， 但 每 个 时 刻 只 有 一 个 生产 者 线程 能 获取 mnutex 信 和 号 
量 。 这 么 一 来 ， 变 量 nput 和 nputval 就 不 会 同时 受 不 止 一 个 生产 者 线程 的 
修改 。 

生产 者 线程 的 终止 

507-51 我 们 必须 仔细 处 理 生产 者 线程 的 终止 。 最 后 一 个 条 目 生 产 
出 来 后 ， 每 个 生产 者 线程 都 执行 人 循环 顶端 的 如 下 一 行 语句 : 

Sem_wait(&shared.nempty); /* wait for at least 1 empty slot */ 

它 将 nempty 信 号 量 减 1。 然 而 每 个 生产 者 线程 在 终止 前 必须 给 该 信 
号 量 加 1， 因 为 它 在 最 后 一 次 走 过 循 环 时 并 没有 往 缓冲 区 中 存 入 一 个 条 
目 。 即 将 终止 的 生产 者 线程 还 得 释放 mnutex 信 号 量 ， 以 允许 其 他 生产 者 
线程 继续 运行 。 要 是 线程 终止 时 我 们 没有 给 nempty 信 号 量 加 1， 而 且 生 
产 者 线程 数 大 于 缓冲 区 槽 位 数 ( 壁 如 说 14 个 生产 者 线程 和 10 个 缓冲 区 
TE) ， 那 么 多 余 的 线程 (4 个 ) 将 永远 阻塞 ， 等 待 nempty 信 和 号 量 ， 从 
而 永远 终止 不 了 。 [5] 

d 10-23 "P AY consume EN ZA H zi 9 EZR tmn pe rn f PSO AB ze EAAS, 
如 果 检 测 到 错误 束 输 出 一 个 消 忆 。 
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62 void * 
63 consume (void *arg) 


64 ( 

65 int i; 

66 for (i = 0; i < nitems; i++) { 

67 Sem_wait (&shared.nstored) ; /* wait for at least 1 stored item */ 
68 Sem_wait (&shared.mutex) ; 

69 if (shared.buff[i % NBUFF] != i) 

70 printf ("error: buff [sd] = d\n", i, shared.buff[i % NBUFF]); 
71 Sem_post (&shared.mutex) ; 

72 Sem_post (&shared.nempty) ; /* 1 more empty slot */ 

73 } 

74 return (NULL) ; 

75 ) 


pxsem/prodcons3.c 


图 10-23 唯一 的 消费 者 线程 执行 的 函数 
这 个 唯一 的 消费 者 线程 的 终止 条 件 非 常 简 单一 一 它 只 需 统计 已 消 
aH H By © 


10.10 多 个 生产 di 


对 于 生产 者 -消费 者 问题 的 进一步 修改 是 允许 多 个 生产 者 和 多 个 消 
费 者 。 具 有 多 个 消费 者 是 否 有 意义 取决 于 具体 应 用 。 作 者 看 到 过 使 用 
这 种 技巧 的 两 个 应 用 程序 。 

(1) 一 个 把 IP 地 址 转换 成 对 应 主机 名 的 程序 。 每 个 消费 者 取 一 个 IP 
地 址 ， 调 用 gethostbyaddr (UNPVI 的 9.6 节 ) ， 然 后 往 某 个 文件 中 添加 得 
出 的 主机 名。 由 于 每 次 调用 gethostbyaddr 所 花 时 间 可 能 不 一 样 ， 因 此 组 
冲 区 中 IP 地 址 的 顺序 通常 与 各 个 消费 者 线程 存 入 结果 的 文件 中 的 主机 
名 顺序 不 一 致 。 这 种 情形 的 优势 在 于 多 个 gethostbyaddr 调 用 (每 个 调用 
可 能 得 花 数 秒 ) 可 以 并 行 地 发 生 : 每 个 消费 者 线程 一 个 调用 。 

这 里 假设 gethostbyaddr 是 一 个 可 重 入 版 本 的 钞 数 ， 然 而 不 是 所 有 实 
现 都 具备 这 个 属性 。 要 是 可 重 入 版 本 的 gethostbyaddr 函 数 不 可 用 ， 候 选 
方法 之 一 就 是 将 缓冲 区 存放 在 共享 内 存 区 中 ， 并 改 用 多 个 进程 代替 多 
个 线程 。 


CO) 一 个 读 出 UDP 数据 报 ， 对 它们 进行 操作 后 把 结 采 写 和 人 某 个 数据 


库 的 程序 。 每 个 数据 报 由 一 个 消费 者 线程 处 理 ， 为 重 仅 可 能 很 花 时 间 
的 每 个 数据 报 的 处 理 ， 需 要 有 多 个 消费 者 线程 。 尽 管 由 消费 者 线程 们 
写 入 数据 库 中 的 数据 报 顺 序 通 党 不 同 于 原来 的 数据 报 顺 序 ， 数 据 库 中 
的 记录 排序 功能 却 能 处 理 顺 序 问题 。 


图 10-24 给 出 了 全 局 变量 。 


pxsem/prodcons4.c 


1 #include "unpipc.h" 


2 #define NBUFF 10 
3 #define MAXNTHREADS 100 


4 int nitems, nproducers, nconsumers; /* read-only */ 

5 struct ( /* data shared by producers and consumers */ 
6 int buff [NBUFF] ; 

7 int nput; /* item number: 0, 1, 2, ... */ 

8 int nputval; /* value to store in buff[] */ 

9 int nget; /* item number: 0, 1, 2, ... */ 

10 int ngetval; /* value fetched from buff[] */ 

11 sem t mutex, nempty, nstored; /* semaphores, not pointers */ 


13 void *produce(void *), *consume(void *); 
pxsem/prodcons4.c 


图 10-24 全 局 变量 


全 局 变量 和 共享 的 结构 
4-12 消费 者 线程 数 现在 是 一 个 全 局 变量 ， 它 是 根据 一 个 命令 行 参 


数 设置 的 。 我 们 还 往 shared 结 构 中 加 了 另外 两 个 变量 : nget 和 ngetval 。 
nget 是 任意 一 个 消费 者 线程 待 取 出 的 下 一 个 条 目的 编号 ，ngetval 则 存放 
相应 的 值 。 


图 10-25 给 出 的 main 函 数 已 修改 成 创建 多 个 消费 者 线程 。 


pxsem/prodcons4.c 


14 int 
15 main(int argc, char **argv) 
16 ( 
17 int i, prodcount [MAXNTHREADS], conscount [MAXNTHREADS] ; 
18 pthread t tid produce[MAXNTHREADS], tid consume [MAXNTHREADS] ; 
19 if (argc !- 4) 
20 err quit("usage: prodcons4 <#items> <#producers> <#consumers>") ; 
21 nitems = atoi(argv[1]); 
22 nproducers = min(atoi(argv[2]), MAXNTHREADS) ; 
23 nconsumers = min(atoi(argv[3]), MAXNTHREADS) ; 
24 /* initialize three semaphores */ 
25 Sem_init (&shared.mutex, 0, 1); 
26 Sem init(&shared.nempty, 0, NBUFF) ; 
27 Sem init(&shared.nstored, 0, 0); 
28 /* create all producers and all consumers */ 
29 Set concurrency (nproducers « nconsumers); 
30 for (i = 0; i < nproducers; i++) { 
31 prodcount [i] = 0; 
32 Pthread create(&tid produce[i], NULL, produce, &prodcount [i]) ; 
33 ) 
34 for (i = 0; i < nconsumers; i++) { 
35 conscount [i] = 0; 
36 Pthread create(&tid consume[i], NULL, consume, &conscount [i] ); 
37 } 
38 /* wait for all producers and all consumers */ 
39 for (i = 0; i < nproducers; i++) { 
40 Pthread join(tid produce[i], NULL); 
41 printf ("producer count[$d] = %d\n", i, prodcount[il); 
42 ) 
43 for (i = 0; i < nconsumers; i++) ( 
图 10-25 创建 多 个 生产 者 和 多 个 消费 者 的 main 函 数 
44 Pthread join(tid consume[i], NULL); 
45 printf ("consumer count [d] = %d\n", i, conscount[i]); 
46 } 
47 Sem_destroy (&shared.mutex) ; 
48 Sem_destroy (&shared.nempty) ; 
49 Sem_destroy (&shared.nstored) ; 
50 exit (0); 
51 } 
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410-25 (28) 

19~23 增设 一 个 新 的 命令 行 选 项 ， 由 它 指定 待 创建 消费 者 线程 的 
总 数 。 我 们 必须 分 配 一 个 数组 (tid_consume) 以 保存 所 有 消费 者 的 线 
程 ID ， 再 分 配 一 个 数组 (conscount) 以 保存 每 个 消费 者 线程 处 理 的 条 
目 数 ， 作 为 诊断 计数 。 


24~50 创建 多 个 生产 者 线程 和 多 个 消费 者 线程 ， 然 后 等 竺 它们 的 
完成 。 

我 们 的 生产 者 函数 舍 有 图 10-22 中 没有 的 一 个 新 行 。 当 所 有 的 生产 
者 线程 完成 生产 工作 时 ， 前 面 标 以 加 号 的 那 一 行 是 新 加 的 : 


if (shared.nput >= nitems){ 


+ Sem_post(&shared.nstored); /* let consumers terminate 
*/ 
Sem_post(&shared.nempty); 
Sem_post(&shared.mutex); 
return( NULL); /* all done */ 
} 
在 处 理 生产 者 线程 和 消费 者 线程 的 终止 时 ， 我 们 仍 得 小 心 。 缓冲 
区 中 所 有 条 目 都 被 消费 挥 之 后 ， 每 个 消费 者 线程 将 阻 窗 在 如 下 调用 
HA 


Sem_wait(&shared.nstored); /* wait for at least 1 stored item 


i 

我 们 让 每 个 生产 者 线程 给 nstored 信 和 号 量 加 1 以 给 各 个 消费 者 线程 解 
阻塞 ， 以 此 让 消费 者 们 看 到 生产 者 们 已 完成 生产 工作 。 

图 10-26 给 出 了 我 们 的 消费 者 函数 。 
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72 void * 

73 consume (void *arg) 

74 ( 

75 int i 

76 for (;;) { 

77 Sem_wait (&shared.nstored) ; /* wait for at least 1 stored item */ 
78 Sem_wait (&shared.mutex) ; 

79 if (shared.nget >= nitems) { 

80 Sem_post (&shared.nstored) ; 

81 Sem_post (&shared.mutex) ; 

82 return (NULL) ; /* all done */ 

83 } 

84 i = shared.nget % NBUFF; 

85 if (shared.buff[i] != shared.ngetval) 

86 printf ("error: buff[%d] = %d\n", i, shared.buff[il); 
87 shared .nget++; 

88 shared.ngetval++; 

89 Sem_post (&shared.mutex) ; 

90 Sem_post (&shared.nempty) ; /* 1 more empty slot */ 
91 *((int *) arg) += 1; 

92 } 

93 } 
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110-26 所 有 消费 者 线程 都 执行 的 函数 


消费 者 线程 的 终止 

797-83 新 的 消费 者 函数 必须 比较 nget 和 nitems， 以 确定 所 有 消费 者 
线程 完成 消费 工作 的 时 刻 (类 似 于 生产 者 函数 ) 。 缓 冲 区 中 最 后 一 个 
条 目 被 消费 掉 之 后 ， 各 个 消费 者 线程 阻 蹇 ， 等 待 nstored 信 和 号 量变 为 大 
于 0。 这 么 一 来 ， 每 个 生产 者 线程 终止 时 ， 应 给 nstored 加 1 以 让 一 个 消 
费 者 线程 终止 。[6] 


10.11 多 个 缓冲 区 


在 处 理 一 些 数据 的 典型 程序 中 ， 我 们 可 以 找到 一 个 如 下 形式 的 循 
Y^: 
while ( (n = read(fdin, buff, BUFFSIZE))> 0)1 
/* process the data */ 


write(fdout,buff,n); 


举例 来 说 ， 处 理 文 本 文件 的 许多 程序 读 入 一 行 输入 ， 对 它 进 行 处 
理 ， 然 后 写 出 一 行 输出 。 对 于 文本 文件 ，read 和 write 调 用 往往 被 巷 换 成 
对 标准 IJO 画 数 fgets 和 fputs 的 调用 。 

图 10-27 展 示 了 实现 这 种 操作 的 一 种 方法 ， 其 中 名 为 reader 的 函数 从 
输入 文件 读 入 数据 ， 名 为 writer 的 函数 往 输出 文件 写 出 数据 。 总 共 使 用 
—^ iip Xo 


reader() 缓冲 区 writer() 


进程 


内 核 


图 10-27 由 一 个 进程 把 数据 读 入 某 个 缓冲 区 ， 再 从 该 缓冲 区 写 出 


图 10-28 给 出 了 整个 操作 的 时 间 线 图 。 我 们 在 时 间 线 的 左边 按 从 上 
到 下 的 时 间 增 长 顺序 标 出 了 数值 ， 时 间 单 位 则 是 某 个 任意 值 。 我 们 假 
设 一 个 读 操 作 花 5 个 单位 时 间 ， 一 个 写 操作 花 7 个 单位 时 间 ， 读 和 写 之 
间 的 处 理 花 2 个 单位 时 间 。 

我 们 可 以 把 这 个 应 用 修改 成 在 两 个 线程 间 分 割 读 写 操 作 ， Pon 
29 所 示 。 这 儿 我 们 使 用 两 个 线程 ， 因 为 各 个 线程 目 动 共 享 同一 个 全 局 
缓冲 区 。 我 们 也 可 以 把 复制 操作 分 割 到 两 个 进程 中 ， ARE 
用 还 没有 讨论 的 共享 内 存 区 。 
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10-28 由 一 个 进程 把 数据 读 入 某 个 缓冲 区 ， 再 从 该 缓冲 区 写 出 


-个 进程 
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进程 
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输出 
文件 


图 10-29 把 文件 复制 操作 分 割 到 两 个 线程 中 
把 读 写 操作 分 割 到 两 个 线程 (或 两 个 进程 ， 中 还 需要 线程 (或 进 
程 ， 间 某 种 形式 的 通知 。 当 缓冲 区 准备 好 写 出 时 ， 读 入 者 线程 必须 通 
知 写 出 者 线程 ; 同样 ， 当 缓冲 区 准备 好 重新 读 入 时 ， 写 出 者 线程 必须 
通知 读 入 者 线程 。 图 10-30 给 出 了 这 种 操作 的 时 间 线 图 。 
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110-30 把 文件 复制 操作 分 割 到 两 个 线程 中 
我 们 假设 处 理 缓冲 区 中 数据 以 及 通知 对 方 线程 花 两 个 单位 时 间 。 
需 特 别 注意 的 是 ， 把 读 和 写 分 割 到 两 个 线程 中 并 不 影响 完成 整个 操作 
所 需 时 间 。 我 们 没有 得 到 任何 速度 上 的 优势 ， 只 是 把 整个 操作 分 割 到 
两 个 线程 《或 进程 ) 中 。 


我 们 在 这 些 时 间 线 图 中 忽略 了 许多 细微 点 。 例 如 ， 大 多 数 Unix 内 
核 检 测 出 对 一 个 文件 的 顺序 读 后 怠 为 读 进 程 执行 对 下 一 个 磁盘 块 的 异 
步 超前 读 (read ahead) 。 这 可 以 改善 执行 这 种 类 型 操作 所 花 的 称 为 “时 
钟 时 间 (clock time) ”的 实际 时 间 量 。 我 们 还 忽略 了 其 他 进程 对 于 我 们 
的 读 入 者 线程 和 写 出 者 线程 的 影响 以 及 内 核 调度 算法 的 效果 。 

接 下 去 我 们 可 以 把 文件 复制 应 用 修改 成 使 用 两 个 线程 (或 进程 ) 
和 两 个 缓冲 区 。 这 就 是 经 典 的 双 缓 冲 (double buffering) 方案 ， 如 图 
10-31 所 示 。 

图 中 画 出 读 入 者 线程 正在 往 第 一 个 缓冲 区 中 读 入 数据 ， 写 出 者 线 
程 正 在 从 第 二 个 缓冲 区 中 写 出 数据 。 这 两 个 缓冲 区 随后 束 在 这 两 个 线 
程 间 来 回 切换 。 

图 10-32 展 示 了 双 缓 冲 方 案 的 时 间 线 图 。 读 入 者 首先 读 入 缓冲 区 1， 
然后 通知 写 出 者 缓冲 区 1 准备 好 处 理 。 读 入 者 随后 开始 读 入 缓冲 区 2， 
其 间 写 出 者 在 从 缓冲 区 1 中 写 出 数据 。 
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图 10-31 使 用 两 个 缓冲 区 把 文件 复制 操作 分 割 到 两 个 线程 


读 入 者 线程 写 出 者 线程 


0 0 
1 1 
de 2 2 
一 3 read() 3 
4 4 
5 5 
SL ex s 
7 7 
8 8 
LA 
‘i read () n 输出 
文件 write () -r 0 
11 11 文件 
12 12 
13 通知 写 入 者 13 
14 14 
15 通知 读 出 者 15 
16 16 
17 17 
输入 18 18 
ze 19 read () | và 输出 
n write() 20 文件 
21 21 
22 —— 通知 写 入 者 m 
23 绥 冲 区 1 23 
24 通知 读 出 者 24 
25 25 
26 26 
输入 27 27 
Ux ia 28 read () a m 输出 
29 write 29 文件 
30 30 
31 通知 写 入 者 31 
33 通知 读 出 者 33 
时 间 时 间 


10-32 双 缓 冲 方 案 的 时 间 线 图 

注意 ， 我 们 不 能 走 得 快 于 最 慢 的 操作 ， 在 本 例子 中 就 古 写 操作 。 
服务 器 完成 前 两 个 读 操 作 后 ， 不 得 不 额外 等 待 2 个 单位 时 间 : 写 操作 所 
花 时 间 (7) 与 读 操作 所 花 时 间 (5) 之 差 。 然 而 对 于 我 们 这 个 假想 的 


例子 来 说 ， 双 缓冲 方案 所 花 的 总 时 钟 时 间 几 乎 只 有 单 缓冲 方案 的 一 

还 要 注意 ， 写 出 操作 现在 是 在 尽 可 能 快 地 发 生 着 ， 每 两 个 写 操作 
闻 仅 有 2 个 单位 时 间作 为 分 了 唱 ， 而 图 10-28 和 图 10-30 中 却 有 9 个 单位 时 间 
作为 分 隔 。 这 种 状况 有 助 于 某 些 像 磁 带 驱 动 器 这 样 的 设备 ， 这 些 设备 
在 尽 可 能 快 地 往 它 们 写 入 数据 的 条 件 下 会 动作 得 更 快 (这 称 为 鱼贯 
(streaming) 模式 ) 。 

有 关 双 缓冲 问题 需 注 意 的 有 趣 之 事 是 ， 它 仅仅 是 生产 者 一 消费 者 
问题 的 一 个 特例 。 

现在 开始 把 以 前 的 生产 者 -消费 者 程序 修改 为 处 理 多 个 缓冲 区 。 我 
们 从 图 10-20 中 使 用 基于 内 存 信号 量 的 方案 入 手 。 新 方案 能 处 理 任意 数 
量 的 缓冲 区 (由 NBUFF 定 义 ) ， 而 不 只 是 个 双 缓 冲 方案 。 图 10-33 给 出 
了 全 局 变量 和 main 芳 数 。 


pxsem/mycat2.c 


1 #include "unpipc.h" 


2 #define NBUFF 8 


3 struct ( /* data shared by producer and consumer */ 
4 struct ( 

5 char data [BUFFSIZE]; /* a buffer */ 

6 ssize t n; /* count of #bytes in the buffer */ 

7 ) buff [NBUFF] ; /* NBUFF of these buffers/counts */ 

8 sem t mutex, nempty, nstored; /* semaphores, not pointers */ 
9 ) shared; 

10 int fd; /* input file to copy to stdout */ 

11 void *produce (void *), *consume (void *) ; 

12 int 

13 main(int argc, char **argv) 

14 { 

45 pthread t tid produce, tid consume; 

16 if (arge != 2) 

17 err quit("usage: mycat2 «pathname»"); 

18 fd - Open(argv[1], O RDONLY); 

19 /* initialize three semaphores */ 

20 Sem init(&shared.mutex, 0, 1); 

21 Sem init(&shared.nempty, 0, NBUFF); 

22 Sem init(&shared.nstored, 0, 0); 

23 /* one producer thread, one consumer thread */ 

24 Set concurrency (2) ; 

25 Pthread create(&tid produce, NULL, produce, NULL) ; /* reader thread */ 
26 Pthread create(&tid consume, NULL, consume, NULL) ; /* writer thread */ 
27 Pthread join(tid produce, NULL); 

28 Pthread join(tid consume, NULL); 

29 Sem destroy (&shared.mutex) ; 

30 Sem destroy (&shared.nempty) ; 

31 Sem_destroy (&shared.nstored) ; 

32 exit (0); 

33 } 


EII 


图 10-33 全 局 变量 和 main 函 数 


声明 NBUFF 个 缓冲 区 
2~9 新 的 shared 结 构 含有 男 一 个 名 为 buff 的 结构 的 数组 ， 而 这 个 新 

结构 含有 一 个 缓冲 区 和 它 的 当前 字 节 计数 。 
打开 输入 文件 
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门将 把 其 内 容 复制 到 标准 输出 的 文件 的 路 径 


10-3425 H1 f producefllconsumeEx Zi » 


pxsem/mycat2.c 


34 void * 

35 produce (void *arg) 

36 ( 

37 int i; 

38 for’ (x mz 

39 Sem wait (&shared.nempty) ; /* wait for at least 1 empty slot */ 
40 Sem wait (&shared.mutex) ; 

41 /* critical region */ 

42 Sem post (&shared.mutex) ; 

43 shared.buff[i].n = Read(fd, shared.buff[i].data, BUFFSIZE); 
44 if (shared.buff[i].n == 0) ( 

45 Sem post(&shared.nstored);  /* 1 more stored item */ 
46 return (NULL); 

47 ) 

48 if (++i >= NBUFF) 

49 i = 0; /* circular buffer */ 

50 Sem_post (&shared.nstored) ; /* 1 more stored item */ 
51 } 

52 } 

53 void * 

54 consume (void *arg) 

55 { 

56 int i; 

57 for (i = 0; ; ) { 

58 Sem_wait (&shared.nstored) ; /* wait for at least 1 stored item */ 
59 Sem_wait (&shared.mutex) ; 

60 /* critical region */ 

61 Sem_post (&shared.mutex) ; 

62 if (shared.buff[i].n == 0) 

63 return (NULL) ; 

64 Write (STDOUT_FILENO, shared.buff[i].data, shared.buff[i].n); 
65 if (++i >= NBUFF) 

66 i = 0; /* circular buffer */ 

67 Sem post (&shared.nempty) ; /* 1 more empty slot */ 

68 ) 

69 ) 


pxsem/mycat2.c 


图 10-34 produce?ilconsumeER Zi 


40~ 42 本 例子 中 由 mutex 锁 住 的 临界 区 是 空 的 。 要 是 数据 绥 冲 区 是 
在 一 个 链表 上 维护 的 ， 那 么 这 儿 就 是 我 们 从 该 链表 中 移出 某 个 缓冲 区 
的 地 方 ， 把 该 操作 放 在 临界 区 中 是 为 了 避免 与 消费 者 对 该 链表 的 操纵 
发 生 冲 突 。 然 而 在 我 们 的 例子 中 ， 生 产 者 只 是 使 用 下 一 个 缓冲 区 ， 而 
且 生 产 者 线程 只 有 一 个 ， 因 此 没有 什么 东西 需 保 护 以 避免 消费 者 干 
扰 。 我 们 仍然 给 出 了 mutex 的 上 锁 和 人 解锁， 目的 是 强调 本 代码 的 其 他 修 
改版 本 中 也 许 需 要 这 些 。 

读 入 数据 并 给 nstored 信 号 量 加 1 

437-49 生产 者 每 获得 一 个 空 内 缓冲 区 就 调用 read。read 返 回 后 生产 
者 将 nstored 信 和 号 量 加 1， 告 诉 消 费 者 该 缓冲 区 准备 好 写 出 。 如 果 read 返 
IO OUFERT) ， 生 产 者 就 在 给 nstored 信 号 量 加 1 后 返回 。 

消费 者 线程 

57--68 消费 者 线程 取出 缓冲 区 中 数据 并 把 它们 的 内 容 写 到 标准 输 
出 。 磁 到 长 度 为 0 的 一 个 缓冲 区 表示 已 到 达 文 件 尾 。 跟 生产 者 函数 一 
样 ， 由 mnutex 保 护 看 的 临界 区 也 是 空 的 。 

我 们 在 UNPV1 的 22.3 市 中 开发 了 一 个 使 用 多 个 缓冲 区 的 例子 。 在 那 
个 例子 中 ， 生 产 者 是 SIGIO 信 号 处 理 程序 ， 消 费 者 是 主 处 理 循 环 
(do echoENZI) 。 在 生产 者 和 消费 者 之 间 共 享 的 变量 是 nqueue 计 数 
角 。 消 费 者 每 次 检查 或 修改 该 计数 器 时 都 阻 窗 SIGIO 信 号 以 防止 它 产 
HE o 


10.12 进程 间 共 享 信号 量 


进程 间 共享 基于 内 存 信号 量 的 规则 很 简单 :信号 量 本 身 (其 地 址 
作为 sm_init 第 一 个 参数 的 sem_t 数 据 类 型 变量 ) 必须 驻 留 在 由 所 有 希望 
共 至 它 的 进程 所 共享 的 内 存 区 中 ， 而 且 sem_init 的 第 二 个 参数 必须 为 
1? 


这 些 规 则 与 进程 间 共 享 互 斥 锁 、 条 件 变 量 或 读 写 锁 的 规则 类 似 : 
同步 对 象 本 上身 ( pthread mutex t 7? & ^ pthread_condt 变 量 或 
pthread rwlock tZF E) 必须 驻 留 在 由 所 有 希望 共享 它 的 进程 所 共享 的 
内 存 区 中 ， 而 且 该 对 象 必须 以 PTHREAD_PROCESS_SHARED 属 性 初 

台 化 。 

至 于 有 名 信号 量 ， 不 同 进程 〈 不 论 彼 此 间 有 无 亲缘 关系 ) 总 是 能 
够 访问 同一 个 有 名 信号 量 ， 只 要 它们 在 调用 sem_open 时 指定 相同 的 名 
字 束 行 。 即 使 对 于 某 个 给 定名 字 的 sem_open 调 用 在 每 个 调用 进程 中 可 
能 返回 不 同 的 指针 ， 使 用 该 指针 的 信号 量 函 数 (例如 sem_post 和 
sem wait) 所 引用 的 仍然 是 同一 个 有 名 信和 号 量 。 

如 果 我 们 在 调用 sem_open 返 回 指 回 某 个 sem_t 数 据 类 型 变量 的 指针 
后 接着 调用 fork， 人 情况 又 会 怎么 样 呢 ? Posix.1 中 有 关 fork 函 数 的 描述 这 
么 说 :“ 在 父 进程 中 打开 的 任何 信号 量 仍 应 在 子 进 程 中 打开 。” 这 意味 
着 如 下 形式 的 代码 是 正确 的 : 

sem t — *mutex; /* global pointer that is copied across the 
fork()*/ 


/* parent creates named semaphore */ 
mutex = Sem_open(Px_ipc_name(NAME),O_CREAT | 
O EXCL,FILE MODE,0); 
if ( (childpid = Fork())== 0){ 
/* child */ 


Sem wait(mutex); 


} 


/* parent */ 


Sem post(mutex); 

我 们 必须 仔细 搞 清 什么 时 候 可 以 或 者 不 可 以 在 不 同 进程 间 共 享 某 
个 信号 量 的 原因 : 一 个 信号 量 的 状态 可 能 包 售 在 它 本 吴 的 sem_t 数 据 类 
型 中 ， 但 它 还 可 能 使 用 其 他 信息 〈 例 如 文件 描述 符 ) 。 我 们 将 在 下 一 
章 看 到 ， 一 个 进程 用 于 描述 一 个 System V 信 号 量 的 唯一 句柄 是 由 semget 
返回 的 它 的 整数 标识 待 。 知 道 这 个 标识 符 的 任何 进程 都 可 以 访问 该 信 
Kn System V 信 号 量 的 所 有 状态 都 包 人 在 内 核 中 ， 它 们 的 整数 标识 

守 只 是 告诉 内 核 具 体 引 用 哪个 信号 量 。 


10.13 信号 量 限制 


Posix 定 义 了 两 个 信号 量 限制 : 
SEM_NSEMS_MAX 一 个 进程 可 同时 打开 着 的 最 大 信号 量 数 
(Posix 要 求 至 少 为 256) ; 

SEM. VALUE MAX 一 个 信号 量 的 最 大 值 (Posix 要 求 至 少 为 
32767) ° 

这 两 个 常 值 通常 定义 在 <unistd.h> 头 文件 中 ， 也 可 在 运行 时 通过 调 
用 sysconf 函 数 获取 ， 如 下 面 的 例子 所 示 。 

例子 : semsysconf 程 序 

图 10-35 中 的 程序 调用 sysconf 输 出 信号 量 的 两 个 由 实现 定义 的 限制 
值 。 


pxsem/semsysconf.c 


1 #include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 


printf("SEM NSEMS MAX = %ld, SEM VALUE MAX = %ld\n", 
Sysconf( SC SEM NSEMS MAX), Sysconf( SC SEM VALUE MAX)); 
exit (0); 


oro Ul 


pxsem/semsysconf.c 


图 10-35 调用 sysconf 获 取信 和 号 量 限 制 值 

在 我 们 的 两 个 系统 上 执行 该 程序 的 结果 如 下 : 

solaris 96 semsysconf 

SEM, NSEMS MAX =  2147483647,5EM VALUE MAX = 
2147483647 

alpha 96 semsysconf 

SEM, NSEMS MAX = 256,SEM_ VALUE MAX = 32767 


10.14 使 用 FIFO 实 现 信号 量 


现在 提供 一 个 使 用 FIFO 完 成 的 Posix 有 名 信号 量 的 实现 。 每 个 有 名 
言 号 量 作为 一 个 使 用 同一 名 字 的 FIFO 来 实现 ， 该 FIFO 中 的 非 负 字 节 数 
代表 该 信号 量 的 当前 值 。sem_post 函 数 往 该 FIFO 中 写 入 1 个 字 闻 ， 
sem_wait 函 数 则 从 该 FIFO 中 读 出 一 个 字 广 (我们 希望 如 果 该 FIFO 为 
空 ， 那 就 阻塞 调用 线程 ) 。sem_open 函 数 在 指定 了 O_CREAT 标 志 的 前 
提 下 创建 待 打开 的 FIFO， 然 后 (不 论 是 否 指 定 了 O_CREAT) 打开 该 
FIFO 两 次 (一 次 用 于 只 读 ， 一 次 用 于 只 写 ) ， 如 果 该 FIFO 是 新 创建 
的 ， 那 就 往 其 中 写 入 作为 信号 量 初始 值 指定 的 那个 数目 的 字 节 。 

本 节 和 本 章 其 余 各 节 含 有 你 第 一 次 阅读 时 可 能 希望 暂时 跳 过 的 高 
级 主题 内 容 。 

我 们 首先 在 图 10-36 中 给 出 semaphore.h 头 文件 ， 它 定义 了 基本 的 
sem_t 数 据 类 型 ? 


my pxsem fifo/semaphore.h 


1 /* the fundamental datatype */ 

2 typedef struct ( 

3 int sem fd[2]; /* two fds: [0] for reading, [1] for writing */ 
4 int sem_magic; /* magic number if open */ 

5 ) sem t; 


6 #define SEM MAGIC 0x89674523 


7 #ifdef SEM FAILED 

8 #undef SEM FAILED 

9 #define SEM FAILED ((sem_t *) (-1)) /* avoid compiler warnings */ 
10 #endif 


my_pxsem_fifo/semaphore.h 


2110-36 semaphore.h 头 文件 


sem_t 数 据 类 型 

17-5 我 们 的 信号 量 数据 结构 包含 两 个 描述 待 ， 一 个 用 于 从 实现 它 
的 FIFO 中 读 ， 一 个 用 于 往 实现 它 的 FIFO 中 写 。 为 与 管道 保持 一 致 ， 我 
们 将 这 两 个 摘 述 符 存 放 在 某 个 仅 有 两 个 元 系 的 数组 中 ， 第 一 个 元 双人 存 
放 读 摘 述 符 ， 第 二 个 元 素 存 放 写 描述 符 。 

一 旦 该 结构 初始 化 ，sem_masgic 成 员 将 含有 党 值 SEM_MAGIC。 接 
受 一 个 sem_t 指 针 作 为 参数 的 每 个 函数 都 检查 该 值 ， 从 而 判定 该 指针 确 
实 指 加 一 个 已 初始 化 的 信号 量 结构 。 

当 关 闭 一 个 信号 量 时 ， 其 sem_t 数 据 结构 中 的 这 个 成 员 将 被 置 为 
0。 这 种 技巧 尽管 不 大 完善 ， 却 有 助 于 检查 一 些 编程 错误 。 

10.14.1 sem_open Wat 

图 10-37 给 出 了 我 们 的 sem_open 函 数 ， 它 创建 一 个 新 的 信号 量 或 打 
开 一 个 已 存在 的 信号 量 。 

创建 一 个 新 的 信号 量 

13-417 如 果 调 用 者 指定 了 O_CREAT 标 志 ， 我 们 就 知道 需要 的 是 四 
个 而 不 是 两 个 参数 。 我 们 调用 va_start 初 始 化 ap 变量 ， 让 它 指 向 最 后 一 
个 命名 过 的 参数 (oflag) 。 然 后 使 用 ap 和 系统 实现 提供 的 va_arg 范 数 获 
取 第 三 和 第 四 个 参数 的 值 。 我 们 已 随 图 5-21 摘 述 过 可 变 参数 表 和 我 们 的 
va_mode_t 数 据 类 型 。 

创建 新 的 FIFO 


18~23 创建 一 个 新 的 FIFO ， 其 名 字 为 调用 者 指定 给 信号 量 的 名 
字 。 跟 4.6 节 中 讨论 过 的 一 样 ， 如 果 该 FIFO 已 经 存在 ，mkfifo 函 数 将 返 
回 一 个 EEXIST 错 误 。 如 果 sem_open 的 调用 者 没有 指定 O_EXCL 标 志 ， 
那么 这 种 错误 无 关 紧 要 ， 不 过 我 们 不 想 以 后 在 本 函数 中 再 次 初始 化 该 
FIFO， 于 是 关 掉 O_CREAT 标 志 。 

分 配 sem_t 数 据 类 型 ， 打 开 FIFO 分 别 用 于 读 和 写 

25~37 为 一 个 sem _t 数 据 类 型 分 配 空间 ， 它 将 含有 两 个 描述 符 。 打 
开 新 创建 或 已 存在 的 FIFO 两 次 ， 一 次 用 于 只 读 ， 一 次 用 于 只 写 。 我 们 
不 想 阻 塞 在 这 两 个 open 调 用 的 任何 一 个 之 中 ， 因 此 在 打开 该 FIFO 只 读 
时 指定 了 O_NONBLOCK 标 志 (回想 图 4-21) 。 当 打开 FIFO 只 写 时 ， 我 
们 也 指定 O_NONBLOCK 标 志 ， 不 过 是 为 了 将 来 检测 溢出 (例如 试图 往 
该 管道 中 写 入 多 于 PIPE_BUF 个 字 节 ) 。 打 开 该 FIFO 两 次 之 后 ， 关 掉 只 
读 描述 符 上 的 非 阻 塞 标志 。 

初始 化 新 创建 信号 量 的 值 

38--42 如 果 创 建 了 一 个 新 的 信号 量 ， 我 们 就 通过 向 实现 它 的 FIFO 
逐个 写 入 总 共 value 个 字 节 来 初始 化 它 的 值 。 如 果 这 个 初始 值 超过 了 系 
统 实现 给 定 的 PIPE_BUF 限 制 ， 那 么 该 FIFO 填 满 后 再 次 调用 的 write 将 返 
回 一 个 EAGAIN 错 误 。 


my pxsem fifo/sem open.c 


1 #include "unpipc.h" 

2 #include "Semaphore.h" 

3 #include «stdarg.h» /* for variable arg lists */ 
4 sem t * 

5 sem open(const char *pathname, int oflag, ... ) 

6 { 

7 int i, flags, save_errno; 

8 char [7 

9 mode t mode; 

10 va list ap; 

11 sem t *sem; 

12 unsigned int value; 

13 if (oflag & O CREAT) ( 

14 va start(ap, oflag); /* init ap to final named argument */ 
15 mode = va arg(ap, va mode t); 

16 value - va arg(ap, unsigned int); 

137 va end(ap); 

18 if (mkfifo(pathname, mode) < 0) { 

19 if (errno == EEXIST && (oflag & O EXCL) == 0) 
20 oflag &= -O CREAT; /* already exists, OK */ 
zi else 

22 return(SEM FAILED); 

23 ) 

24 ) 

25 if ( (sem - malloc(sizeof(sem t))) -- NULL) 

26 return (SEM FAILED); 

zy sem-»sem fd[0] = sem-»sem fd[1] = -1; 

28 if ( (sem-»sem fd[0] = open(pathname, O RDONLY | O NONBLOCK)) < 0) 
29 goto error; 

30 if ( (sem-»sem fd[1] = open(pathname, O WRONLY | O NONBLOCK)) < 0) 
31 goto error; 

32 /* turn off nonblocking for sem fd[0] */ 

33 if ( (flags = fcntl(sem-»sem fd[0], F GETFL, 0)) < 0) 
34 goto error; 

35 flags &- -O NONBLOCK; 

36 if (fcntl(sem-»sem fd[0], F SETFL, flags) « 0) 

37 goto error; 

38 if (oflag & O CREAT) { /* initialize semaphore */ 
39 for (i = 0; i < value; i++) 
40 if (write(sem-»sem fd[1], &c, 1) != 1) 
41 goto error; 
42 } 
43 sem->sem_magic = SEM MAGIC; 
44 return (sem) ; 


45 error: 


46 Save errno = errno; 

47 if (oflag & O_CREAT) 

48 unlink (pathname) ; /* if we created FIFO */ 
49 close (sem-»sem fd[0]); /* ignore error */ 

50 close (sem-»sem fd[1]); /* ignore error */ 

Sx free (sem) ; 

52 errno = save_errno; 

53 return (SEM_FAILED) ; 

54 } 


my_pxsem_fifo/sem_open.c 


图 10-37 sem. openER Zt 


10.14.2 sem_close RA 
图 10-38 给 出 了 我 们 的 sem_close 函 数 。 


my pxsem fifo/sem close.c 


1 include "unpipc.h" 

2 #include "semaphore.h" 

3 int 

4 sem close(sem t *sem) 

5 { 

6 if (sem->sem_magic != SEM MAGIC) { 

7 errno = EINVAL; 

8 return (-1) ; 

9 } 
10 sem-»sem magic = 0; /* in case caller tries to use it later */ 
11 if (close(sem->sem fd[0]) == -1 || close(sem->sem fd[1]) == -1) { 
12 free (sem) ; 
13 return (-1); 
14 } 
X5 free (sem); 

16 return(0); 
17 ij 


my pxsem fifo/sem close.c 


图 10-38 sem closeEX aX 


117-15 close 由 调用 者 指定 的 信号 量 结构 中 的 两 个 FIFO 描 述 符 ， 
free 分 配给 这 个 sem_t 数 据 类 型 的 空间 。 

10.14.3 sem_unlink AX 

图 10-39 给 出 了 我 们 的 sem_unlink 画 数 ， 由 它 删 除 与 某 个 信号 量 关 
联 的 名 字 。 它 只 是 调用 Unix 的 unlink 函 数 。 


my pxsem fifo/sem unlink.c 


1 #include "unpipc.h" 

2 include "Semaphore.h" 

3 int 

4 sem unlink(const char *pathname) 
5 { 

6 return (unlink (pathname) ) ; 
7) 


my pxsem fifo/sem unlink.c 


图 10-39 sem unlinkEX 2 


10.14.4 sem_post HA 


图 10-40 给 出 了 我 们 的 sem_post 函 数 ， 由 它 将 某 个 信号 量 的 值 加 1。 

117-12 往 与 由 调用 者 指定 的 信号 量 相 关联 的 FIFO 中 写 入 一 个 任意 
字 节 。 如 果 该 FIFO 完 前 是 空 的 ， 那么 这 个 写 入 操作 将 唤醒 阻 窄 在 该 
FIFO 上 的 read 调 用 中 等 待 一 个 数据 字 下 的 任意 进程 。 


my pxsem fifo/sem post.c 


1 #include "unpipc.h" 

2 #include "semaphore.h" 

3 int 

4 sem post(sem t *sem) 

5 { 

6 char es 

7 if (sem-»sem magic != SEM MAGIC) { 
8 errno - EINVAL; 

9 return(-1); 

10 

11 if (write(sem-»sem fd[1], &c, 1) == 1) 
12 return(0); 
13 return(-1); 
14 } 


my pxsem fifo/sem post.c 


图 10-40 sem. postÉR 2 


10.14.5 sem waitER 2X 
图 10-41 给 出 了 我 们 的 最 后 一 个 函数 sem_wait 。 


my pxsem fifo/sem wait.c 


1 #include "unpipc.h" 

2 #include "semaphore.h" 

3 int 

4 sem wait(sem t *sem) 

5 { 

6 char c 

7 if (sem-»sem magic !- SEM MAGIC) { 
8 errno - EINVAL; 

9 return(-1); 

10 } 

ga if (read(sem-»sem fd[0], &c, 1) -- 1) 
12 return (0) ; 
13 return (-1) ; 
14 } 


my_pxsem_fifo/sem_wait.c 


图 10-41 sem_wait 函 数 


117-12 从 与 由 调用 者 指定 的 信号 量 相 关联 的 FIFO 中 read 175€ 75, 
如 果 该 FIFO 已 为 空 ， 那 束 阻 塞 。 

我 们 没有 实现 sem_trywait 函 数 ， 但 是 通过 局 用 与 其 信号 量 天 联 的 
FIFO 的 非 阻塞 标志 后 再 调用 read ， 就 能 做 到 。 我 们 也 没有 实现 
sem_getvalue 函 数 。 当 调用 stat 或 fstat 函 数 时 ， 某 些 实现 会 返回 当前 在 某 
个 管道 或 FIFO 中 的 字 节 数 ， 它 是 作为 所 返回 stat 结 构 的 st_size 成 员 给 出 
的 。 然 而 Posix 并 不 保证 这 一 点 ， 因 而 是 不 可 移植 的 。 下 一 市 中 将 给 出 
这 两 个 Posix 信 和 号 量 函 数 的 实现 。 


10.15 使 用 IO 实现 量 


我 们 现在 提供 一 个 使 用 内 存 映 射 TO 以 及 Posix 互 斥 锁 和 条 件 变 量 完 
成 的 Posix 有 名 信号 量 的 实现 。 [IEEE 1996] 的 B.11.3 节 (基本 原理 部 
4j) 中 也 提供 了 一 个 类 似 的 实现 。 

我 们 将 在 第 12 章 和 第 13 章 中 讨论 内 存 映射 I/O。 你 可 能 希望 跳 过 本 
节 ， 到 阅读 完 那 两 章 后 再 返回 来 。 

我 们 首先 在 图 10-42 中 给 出 自己 的 semaphore.h 尖 文件 ， 它 定义 了 基 
本 的 sem_t 数 据 类 型 。 


my pxsem mmapf/semaphore.h 
al /* the fundamental datatype */ 
2 typedef struct { 
3 pthread_mutex_t sem mutex; /* lock to test and set semaphore value */ 
4 pthread cond t sem cond; /* for transition from 0 to nonzero */ 
5 unsigned int sem count; /* the actual semaphore value */ 
6 int sem magic; /* magic number if open */ 
7 } sem t; 
8 #define SEM MAGIC 0x67458923 
9 #ifdef SEM FAILED 
10 #undef SEM FAILED 
11 #define SEM FAILED  ((sem t *)(-1)) /* avoid compiler warnings */ 
12 #endif 
my pxsem mmap/semaphore.h 


图 10-42 semaphore.h 3. X fF 


sem_t 数 据 类 型 


17-7 我 们 的 信号 量 数据 结构 含有 一 个 互 斥 锁 、 一 个 条 件 变 量 和 包 
舍 本 信号 量 当 前 值 的 一 个 无 符号 整 效 。 正 如 随 图 10-36 讨 论 的 那样 ， 
旦 该 结构 已 被 初始 化 ， 其 sem_magic 成 员 将 含有 SEM_MAGIC 值 。 

10.15.1 sem openER2X 

图 10-43 给 出 了 我 们 的 sem_open 函 数 的 前 半 部 分 ， 它 会 创建 一 个 新 
的 信和 号 量 或 打开 一 个 已 存在 的 信号 量 。 


my_pxsem_mmap/sem_open.c 


1 #include "unpipc.h" 

2 #include "semaphore.h" 

3 #include «stdarg.h» /* for variable arg lists */ 

4 #define MAX TRIES 10 /* for waiting for initialization */ 


5 sem t * 

6 sem open(const char *pathname, int oflag, ... ) 
7 

8 


{ 


int fd, i, created, save_errno; 
9 mode_t mode; 
10 va_list ap; 
11 sem t *sem, seminit; 
12 struct stat statbuff; 
13 unsigned int value; 
14 pthread_mutexattr_t mattr; 
15 pthread condattr t cattr; 
16 created - 0; 
17 sem - MAP FAILED; /* [sic] */ 
18 again: 


图 10-43 sem openEX Zi: 前 半 部 分 
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43 
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59 
60 
61 
62 
63 
64 
65 
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67 
68 


if (oflag & O CREAT) ( 


va start(ap, oflag); /* init ap to final named argument */ 
mode = va arg(ap, va mode t) & -S IXUSR; 

value - va arg(ap, unsigned int); 

va end(ap); 


/* open and specify O EXCL and user-execute */ 
fd - open(pathname, oflag | O EXCL | O RDWR, mode | S IXUSR); 
if (fd < 0) { 
if (errno == EEXIST && (oflag & O_EXCL) == 0) 
goto exists; /* already exists, OK */ 
else 
return(SEM FAILED); 
) 
created - 1; 
/* first one to create the file initializes it */ 
/* set the file size */ 
bzero(&seminit, sizeof (seminit)); 
if (write(fd, &seminit, sizeof(seminit)) !- sizeof(seminit)) 
goto err; 


/* memory map the file */ 
sem - mmap(NULL, sizeof(sem t), PROT READ | PROT WRITE, 
MAP SHARED, fd, 0); 
if (sem -- MAP FAILED) 
goto err; 


/* initialize mutex, condition variable, and value */ 
if ( (i = pthread mutexattr init(&mattr)) != 0) 

goto pthreaderr; 
pthread mutexattr setpshared(&mattr, PTHREAD PROCESS SHARED); 
i = pthread mutex init(&sem-»sem mutex, &mattr); 
pthread mutexattr destroy(&mattr); /* be sure to destroy */ 
if (i t= Q) 

goto pthreaderr; 


if ( (i = pthread condattr init(&cattr)) !- 0) 

goto pthreaderr; 
pthread condattr setpshared(&cattr, PTHREAD PROCESS SHARED); 
i = pthread cond init(&sem-»sem cond, &cattr); 
pthread condattr destroy(&cattr); /* be sure to destroy */ 
if (i != 0) 

goto pthreaderr; 


if ( (sem-»sem count = value) > sysconf( SC SEM VALUE MAX)) { 
errno - EINVAL; 
goto err; 


) 
/* initialization complete, turn off user-execute bit */ 
if (fchmod(fd, mode) == -1) 
goto err; 
close(fd); 
sem-»sem magic = SEM MAGIC; 
return (sem); 


my pxsem mmap/sem open.c 


图 10-43 ( 续 ) 


处 理 可 变 参 数 表 

14~23 如 果 调 用 者 指定 了 O_CREAT 标 志 ， 我 们 就 知道 需要 的 是 四 
个 而 不 是 两 个 参数 ， 我 们 已 随 图 5-21 讲 述 过 可 变 参 数 表 和 我 们 的 
va mode t 数 据 类 型 。 接 着 关 挥 mode 变量 中 的 用 户 执 行 位 

(S_IXUSR) ， 其 原因 稍 后 讲述 。 

创建 一 个 新 的 信号 量 ， 并 处 理 潜 在 的 竞争 状态 

24~32 创建 一 个 新 文件 ， 其 名 字 为 调用 者 命名 信和 号 量 所 用 的 名 
字 ， 同 时 打开 它 的 用 户 执行 位 。 在 调用 者 指定 了 O_CREAT 标 志 的 前 提 
下 ， 如 果 我 们 只 是 打开 该 文件 ， 内 存 映射 其 内 容 ， 然 后 初始 化 sem_t 结 
构 的 三 个 成 员 ， 那 束 会 碰 到 一 个 竞争 状态 。 我 们 已 随 图 5-21 朱 述 过 该 竞 
争 状 态 ， 这 儿 所 用 的 处 理 技 巧 跟 那 儿 给 出 的 一 样 。 在 图 10-52 中 我 们 还 
会 碰 到 一 个 类 似 的 竞争 状态 。 

设置 文件 大 小 

33--37 通过 往 其 中 写 入 一 个 用 0 填充 的 结构 来 设置 新 创建 文件 的 大 
小 。 既 然 知 道 刚 创建 的 文件 的 大 小 为 0， 于 是 我 们 调用 write 而 不 是 
ftruncate 来 设置 文件 大 小 ， 因 为 正如 我 们 在 13.3 节 中 所 注 ， 当 一 个 普通 
文件 的 大 小 有 竺 增长 时 ，Posix 并 不 保证 ftruncate 能 够 工作 。 

内 存 映射 文件 

38~42 调用 mmap 对 新 创建 的 文件 进行 内 存 映 射 。 该 文件 将 含有 所 
创建 信号 量 sem_t 数 据 结构 的 当前 值 ， 不 过 既然 已 内 存 映 射 了 该 文件 ， 
我 们 驶 只 通过 由 mmap 返 回 的 指针 来 访问 它 ， 而 从 不 调用 read 或 write 。 

初始 化 sem_t 数 据 结 构 

3~57 初始 化 内 存 映 射 文件 中 的 sem i 数据 结构 的 三 个 成 员 ， 互 斥 
锁 、 条 件 变量 、 信 和 号 量 的 值 。 既 然 Posix 有 名 信号 量 可 由 知道 其 名 字 并 
有 足够 权限 的 任意 进程 共享 ， 因 此 在 初始 化 互 斥 锁 和 条 件 变量 成 员 
时 ， 我 们 必须 指定 PTHREAD_PROCESS_SHARED 属 性 。 对 于 互 斥 锁 


成 员 的 做 法 是 : 首先 调用 pthread_mutexattr_init 初 始 化 它 的 属性 ， 然 后 
调用 pthread_mnutexattr_setpshared 在 该 属性 结构 中 设置 进程 间 共 享 属 
性 ， 最 后 调用 pthread_mutex_init 初 始 化 该 互 不 锁 。 对 于 条 件 变 量 成 员 也 
有 几乎 相同 鸭 做 法 。 我 们 小 心地 保证 在 出 钳 情 况 下 摧毁 这 些 属性 对 
Fe o 

初始 化 信号 量 值 

587-61 最 后 存 入 信号 量 的 初始 值 ， 我 们 还 把 该 值 与 通过 调用 
sysconf (10.1377) 获取 的 最 大 允许 值 作 比 较 。 

关 掉 用 户 执 行 位 

62--67 完成 信号 量 的 初始 化 后 ， 关 掉 用 户 执行 位 。 它 指示 信和 号 量 
已 初始 mo 接着 close 已 内 存 映射 了 的 文件 ， 因 为 已 没有 保 
持 它 继续 打开 着 的 必要 了 。 

图 10-44 给 出 了 我 们 的 sem_open 函 数 的 后 半 部 分 。 在 这 里 处 理 前 面 
提 到 过 的 竞争 状态 的 技巧 与 图 5-23 中 所 用 的 技巧 相同 。 

打开 已 存在 的 信号 量 

69~78 我 们 是 在 调用 者 没有 指定 O_CREAT 标 志 或 者 尽管 指定 了 但 
所 需 信和 号 量 已 存在 的 条 件 下 到 达 这 儿 的 。 无 论 哪 种 情况 下 ， 我 们 都 要 
打开 一 个 已 存在 的 信号 量 。 我 们 open 含 有 所 需 sem_t 数 据 类 型 的 文件 用 
于 读 和 写 ， 并 把 该 文件 内 存 映射 到 当前 进程 的 地 址 空间 中 (使 用 


mmap) 。 


my pxsem mmap/sem open.c 


exists: 
if ( (fd = open(pathname, O RDWR)) < 0) { 
if (errno -- ENOENT && (oflag & O CREAT)) 
goto again; 
goto err; 
) 
sem - mmap(NULL, sizeof(sem t), PROT READ | PROT WRITE, 
MAP SHARED, fd, 0); 
if (sem -- MAP FAILED) 
goto err; 


/* make certain initialization is complete */ 
for (i = 0; i < MAX TRIES; i++) { 


if (stat(pathname, &statbuff) -- -1) ( 
if (errno == ENOENT && (oflag & O CREAT)) { 
close (fd); 


goto again; 
) 


goto err; 


if ((statbuff.st mode & S IXUSR) -- O) ( 
close(fd); 
Sem-»sem magic = SEM MAGIC; 
return(sem); 
) 
sleep(1); 
) 
errno - ETIMEDOUT; 
goto err; 


pthreaderr: 
errno = i; 
err: 
/* don't let munmap() or close() change errno */ 
Save errno - errno; 
if (created) 
unlink (pathname) ; 
if (sem != MAP FAILED) 
munmap (sem, sizeof (sem t)); 
close (fd); 
errno - save errno; 
return(SEM FAILED); 


my pxsem mmap/sem open.c 


图 10-44 sem openERZA: 后 半 部 分 


现在 可 以 看 出 为 什么 Posix.1 声 称 : “访问 信号 量 的 副本 将 产生 未 定 


义 的 结 


”。 当 使 用 内 存 映 射 XO 来 实现 有 名 信号 量 时 ， 信 号 量 ( 即 


sem_t 数 据 类 型 ) 会 内 存 映 射 到 让 它 打开 着 的 所 有 进程 的 地 址 空间 中 。 
这 是 由 打开 该 有 名 信和 号 量 的 每 个 进程 调用 sem_open 来 完成 的 。 任 意 一 
个 进程 对 该 信号 量 所 做 的 变动 〈 例 如 改变 它 的 计数 值 ) 由 所 有 其 他 进 


程 通过 内 存 映射 当场 看 到 。 要 是 我 们 去 制造 某 个 sem_t 数 据 结构 的 私 用 
副本 ， 那 么 该 副本 将 不 再 为 所 有 进程 所 共享 。 即 使 我 们 可 能 认为 它 在 
工作 〈 针 对 它 的 信号 量 函 数 也 许 不 会 给 出 错误 ， 至 少 在 调用 sem_close 
之 前 有 这 种 可 能 ， 而 sem_close 是 要 撤销 映射 的 ， 因 此 关闭 私 用 副本 肯 
定 失 败 ) ， 本 进程 与 其 他 进程 间 也 不 会 发 生 同 步 。 然 而 从 图 1-6 可 注意 
到 ， 父 进程 中 的 内 存 映射 区 穿越 fork 后 继续 在 子 进程 中 存留 ， 因 此 由 内 
核 完成 的 从 父 进 程 到 子 进程 罕 越 fork 进 行 的 信号 量 复 制 是 可 行 的 。 

确保 信号 量 已 初始 化 

79--96 我 们 必须 等 竺 刚才 打开 的 信号 量 完成 初始 化 〈 以 防 多 个 线 
程 几乎 同时 尝试 创建 同一 个 信号 量 ) 。 为 此 ， 我 们 调用 stat 查 看 内 存 映 
射 文件 的 权限 (stat 结 构 的 st_mode 成 员 ) 。 如 果 它 的 用 户 执 行 位 已 关 
掉 ， 那 么 该 信号 量 已 完成 初始 化 。 

出 错 返 回 

97~108 当 出 错时 ， 我 们 小 心地 保证 不 改变 errmmo 的 值 。 

10.15.2 sem_close 画 数 

图 10-45 给 出 了 我 们 的 sem_close 芳 数 ， 它 只 是 对 先前 映射 的 内 存 区 
调用 munmap。 要 是 调用 者 继续 使 用 由 以 前 的 sem_open 调 用 返回 并 作为 
参数 传递 给 本 函数 的 指针 ， 那 么 它 将 收 到 一 个 SIGSEGV 信 号。 


my pxsem mmap/sem close.c 


1 #include "unpipc.h" 

2 #include "semaphore.h" 
3 int 

4 sem_close(sem_t *sem) 


6 if (sem->sem_magic != SEM MAGIC) { 

7 errno = EINVAL; 

8 return (-1) ; 

9 } 

10 if (munmap(sem, sizeof(sem_t)) == -1) 
11 return (-1) ; 

12 return (0); 


my_pxsem_mmap/sem_close.c 


图 10-45 sem closeEk AX 


10.15.3 sem_unlink RAL 
图 10-46 给 出 了 我 们 的 sem_unlink 画 数 ， 由 它 删 除 与 某 个 信号 量 关 
联 的 名 字 。 它 仅仅 调用 Unix 的 unlink 函 数 。 


my pxsem mmap/sem unlink.c 


1 #include "unpipc.h" 

2 #include "semaphore.h" 

3 int 

4 sem unlink(const char *pathname) 
5 { 

6 if (unlink(pathname) == -1) 
" return(-1); 

8 return(0); 

9 } 


my_pxsem_mmap/sem_unlink.c 


图 10-46 sem_unlink kK ži 


10.15.4 sem. post ER AX 

图 10-47 给 出 了 我 们 的 sem_post 芳 数 ， 它 会 给 某 个 信号 量 的 值 加 1， 
如 果 此 前 该 信号 量 的 值 为 0， 那 就 唤醒 因 等 竺 该 信号 量 而 阻塞 的 任意 线 
程 。 


my pxsem mmap/sem post.c 


1 #include "unpipc.h" 

2 #include "semaphore.h" 

3 int 

4 sem post (sem t *sem) 

5 { 

6 int n; 

7 if (sem-»sem magic != SEM MAGIC) { 

8 errno = EINVAL; 

9 return (-1); 

10 } 

11 if ( (n = pthread_mutex_lock(&sem->sem_mutex)) != 0) { 
12 errno = n; 

13 return (-1) ; 

14 } 

15 if (sem->sem_count == 0) 

16 pthread_cond_signal (&sem->sem_cond) ; 
17 sem->sem_count++; 

18 pthread_mutex_unlock (&sem->sem_mutex) ; 
19 return (0) ; 

20 } 


my_pxsem_mmap/sem_post.c 


图 10-47 sem_post 函 数 


117-18 在 修改 由 调用 者 指定 的 信号 量 的 值 之 前 ， 首 移 得 获取 它 的 
互 矿 锁 。 如 有 果 该 信号 量 的 值 将 从 0 增 为 1， 那 吏 调 用 pthread_cond_signal 
唤醒 等 待 它 的 任意 一 个 线程 。 

10.15.5 sem waitEN2 

图 10-48 给 出 了 我 们 的 sem_wait 函 数 ， 它 等 待 某 个 信号 量 的 值 超过 


0 o 
my_pxsem_mmap/sem_waitt.c 
1 #include "unpipc.h" 
2 #include "semaphore.h" 
3 int 
4 sem wait(sem t *sem) 
5 
6 int n; 
7 if (sem-»sem magic != SEM MAGIC) { 
8 errno - EINVAL; 
9 return(-1); 
10 } 
11 if ( (n = pthread_mutex_lock(&sem->sem_mutex)) != 0) { 
12 errno = n; 
13 return (-1); 
14 } 
15 while (sem->sem_count == 0) 
16 pthread_cond_wait (&sem->sem_cond, &sem->sem_mutex) ; 
17 sem-»sem count--; 
18 pthread mutex unlock(&sem-»sem mutex); 
19 return(0); 
20 } 


my pxsem mmap/sem wait.c 


图 10-48 sem_wait 函 数 

11~18 在 修改 由 调用 者 指定 的 信号 量 的 值 之 前 ， 首 移 得 获取 它 的 
互 斥 锁 。 如 果 该 信号 量 的 值 为 0， 那 融 让 调用 线程 睡眠 在 一 
pthread_cond_wait 调 用 中 ， 等 待 另 外 某 个 线程 为 该 信号 量 的 条 件 变 量 调 
用 pthread_cond_signal， 到 那 时 该 信号 量 的 值 将 由 那个 线程 从 0 增 为 1。 
该 值 一 旦 大 于 0， 本 函数 就 将 它 减 1， 然 后 释放 关联 的 互 不 锁 。 

10.15.6 sem_trywait BAY 

图 10-49 给 出 了 我 们 的 sem_trywait 函 数 ， 它 是 sem_wait 函 数 的 非 阻 
FEAR © 


my pxsem mmap/sem trywailt.c 


1 #include "unpipc.h" 
2 #include "semaphore.h" 
3 int 


4 sem trywait(sem t *sem) 


5 { 


6 int n, Bas 

7 if (sem-»sem magic != SEM MAGIC) { 

8 errno - EINVAL; 

9 return(-1); 

10 ) 

11 if ( (n = pthread mutex lock(&sem-»sem mutex)) != 0) { 
12 errno = n; 

13 return (-1) ; 

14 ) 

15 if (sem-»sem count > 0) { 

16 sem-»sem count--; 

17 rG = Qr 

18 } else { 

19 re = -1; 

20 errno = EAGAIN; 

21 } 

22 pthread_mutex_unlock (&sem->sem_mutex) ; 
23 return (rc) ; 

24 } 


my_pxsem_mmap/sem_trywait.c 


图 10-49 sem trywaitER 2X 

11-22 获取 由 调用 者 指定 的 信号 量 的 互 斥 锁 后 检查 它 的 值 。 如 采 
该 值 大 于 0， 那 就 将 它 减 1 并 返回 0。 否 则 返回 值 为 -1， 同 时 置 errmo 为 
EAGAIN ? 

10.15.7 sem getvalueEN2N 

10-5026 E T FR Hea — T ER XX sem, getvalue, EZREN E 
号 量 的 当前 值 。 


my pxsem mmap/sem getvalue.c 


1 #include "unpipc.h" 

2 #include "semaphore.h" 

int 

sem getvalue(sem t *sem, int *pvalue) 


{ 


nu 4» UJ 


int n; 


7 if (sem-»sem magic !- SEM MAGIC) { 
8 errno - EINVAL; 
9 return(-1); 


图 10-50 sem. getvalueEk Zt 


10 } 


11 if ( (n = pthread mutex lock(&sem-»sem mutex)) != 0) { 
12 errno = n; 

13 return(-1); 

14 } 

15 *pvalue = sem-»sem count; 

16 pthread mutex unlock(&sem-»sem mutex); 

17 return(0); 

18 ) 


my pxsem mmap/sem getvalue.c 


图 10-50 (2) 

117-16 获取 由 调用 者 指定 的 信号 量 的 互 斥 锁 后 返回 它 的 值 。 

从 本 市 提供 的 实现 可 以 看 出 ， 使 用 信和 号 量 比 使 用 互 不 锁 和 条 件 变 
量 要 人 简单。 


10.16 使 用 System V 信 号 量 实现 Posix 信 号 量 


我 们 现在 提供 使 用 System V 信 号 量 完 成 的 Posix 有 名 信号 量 的 又 一 
个 实现 。 既 然 较 早 的 System V 信 号 量 实现 与 较 新 的 Posix 信 号 量 实现 相 
比 更 为 普遍 ， 那 么 本 实现 允许 应 用 程序 在 操作 系统 还 不 支持 Posix 信 号 
量 的 情况 下 残 开 始 使 用 它们 。 

我 们 将 在 第 11 章 中 讨论 System V 信 号 量 。 你 可 能 希望 暂时 跳 过 本 
节 ， 到 阅读 完 那 一 章 之 后 再 返回 来 。 

我 们 首先 在 图 10-51 中 给 出 semaphore.h 头 文件 ， 它 定义 了 基本 的 
sem_t 数 据 类 型 。 


my pxsem svsem/semaphore.h 


d: /* the fundamental datatype */ 

2 typedef struct { 

3 int sem semid; /* the System V semaphore ID */ 
4 int sem magic; /* magic number if open */ 

5 } sem t; 


6 #define SEM_MAGIC 0x45678923 


7 #ifdef SEM FAILED 
8 #undef SEM FAILED 


9 #define SEM FAILED  ((sem t *)(-1)) /* avoid compiler warnings */ 

10 #endif 

11 #ifndef SEMVMX 

12 #define SEMVMX 32767 /* historical System V max value for sem */ 
13 #endif 


my pxsem svsem/semaphore.h 


图 10-51 semaphore.h 头 文件 


sem_t 数 据 类 型 

17-5 我们 使 用 仅 由 一 个 成 员 构 成 的 System V 信 和 号 量 集 来 实现 Posix 
有 名 信号 量 。 这 个 信号 量 数 据 结构 包含 对 应 的 System V 信 和 号 量 ID 和 一 
个 魔 数 (我 们 已 随 图 10-36 讨 论 过 魔 数 的 用 途 ) e 

10.16.1 sem openER2 

图 10-52 给 出 了 我 们 的 sem_open 函 数 的 前 半 部 分 ， 该 函数 创建 一 个 
新 的 信号 量 或 打开 一 个 已 存在 的 信号 量 。 


\D 0 ~ 0) Ul D w NH 


#include 
#include 


#include 
#define 


sem t * 


"unpipc.h" 
"semaphore.h" 


«stdarg.h» /* for variable arg lists */ 


my pxsem svsem/sem open.c 


MAX TRIES 10 /* for waiting for initialization */ 


sem open(const char *pathname, int oflag, 


{ 


int 


i, fd, semflag, semid, save errno; 
key t key; 

mode t mode; 

va list ap; 

sem t *sem; 

union semun arg; 
unsigned int value; 
struct semid_ds seminfo; 
struct sembuf initop; 


/* no mode for sem_open() w/out O_CREAT; guess */ 


semflag = SVSEM MODE; 
semid = -1; 


if ( 


oflag & O CREAT) { 
va_start(ap, oflag) ; 
mode = va arg(ap, va mode t); 
value - va arg(ap, unsigned int); 
va end(ap); 


/* init ap to final named argument */ 


/* convert to key that will identify System V semaphore */ 


if ( (fd = open(pathname, oflag, mode)) == -1) 
return(SEM FAILED); 

close(fd); 

if ( (key = ftok(pathname, 0)) == (key t) -1) 


return(SEM FAILED); 


semflag - IPC CREAT | (mode & 0777); 
if (oflag & O EXCL) 
semflag |= IPC EXCL; 


/* create the System V semaphore with IPC EXCL */ 
if ( (semid = semget(key, 1, semflag | IPC EXCL)) >= 0) { 
/* success, we're the first so initialize to O */ 


arg.val - 0; 


if (semctl(semid, 0, SETVAL, arg) -- -1) 


goto err; 


/* then increment by value to set sem otime nonzero */ 


if (value » SEMVMX) ( 
errno - EINVAL; 


goto err; 
) 
initop.sem num - 0; 
initop.sem op = value; 
initop.sem flg - 0; 
if (semop(semid, &initop, 1) -- -1) 


goto err; 
goto finish; 


) else if (errno !- EEXIST || (semflag & IPC EXCL) 


goto err; 
/* else fall through */ 


图 10-52 sem openENZÁ: 


前 


Liz 


部 分 


!= 0) 


my pxsem svsem/sem open.c 


创建 一 个 新 的 信号 量 ， 处 理 可 变 长 度 参 数 表 

20~24 如 果 调 用 者 指定 了 O_CREAT 标 志 ， 我 们 就 知道 需要 的 是 四 
个 而 不 是 两 个 参数 。 我 们 已 随 图 5-21 描 述 过 可 变 长 度 参数 表 的 处 理 和 我 
们 有 的 va_mode tft 数据 类 型 。 

创建 辅助 文件 ， 将 其 路 径 名 映射 成 System V IPC 键 

25~30 创建 一 个 普通 文件 ， 其 路 径 名 为 调用 者 命名 Posix 信 号 量 所 
用 的 名 字 。 创 建 该 文件 的 目的 只 是 为 了 有 一 个 路 径 名 可 供 ftok 用 来 标识 
该 信和 号 量 。 调 用 者 给 该 信号 量 指 定 的 oflag 参 数 可 以 是 O_CREAT 或 
O_CREAT | O_EXCL， 它 用 在 打开 辅助 文件 的 open 调 用 中 。 这 样 ， 如 果 
该 文件 尚未 存在 ， 那 就 创建 它 ， 如 果 该 文件 已 存在 而 且 调 用 者 指定 了 
O_EXCL 标 志 ， 那 就 返回 一 个 错误 。 接 着 关闭 该 文件 的 描述 符 ， 因 为 该 
文件 的 唯一 用 途 是 作为 ftok 的 参数 ， 由 ftok 将 其 路 径 名 转换 成 一 个 
System V IPC 键 (3.277) ° 

创建 仅 有 一 个 成 员 的 System V 信 和 号 量 集 

31~33 把 O_CREAT 和 O_EXCL 这 两 个 常 值 转换 成 对 应 的 System V 
IPC_xxx 常 值 后 ， 调 用 semget 创 建 一 个 仅 由 单个 成 员 构 成 的 System V 信 
号 量 集 。 我 们 总 是 指定 IPC_EXCL 标 志 ， 目 的 是 为 了 确定 该 System V 信 
号 量 是 否 存在 。 

初始 化 信号 量 

34~50 11.2 节 将 叙述 初始 化 System V 信 号 量 时 存在 的 一 个 基本 问 
题 ，11.6 广 将 给 出 避免 其 中 潜在 的 竞争 状态 的 代码 。 这 儿 使 用 类 似 的 技 
巧 。 党 试 创 建 那个 System V 信 号 量 的 第 一 个 线程 (回想 一 下 ， 我 们 调 
用 semget 时 总 是 指定 IPC_EXCL) 将 使 用 semctl 的 SETVAL 命 令 将 它 初始 
化 为 0， 然 后 调用 semop 把 它 设置 成 由 调用 者 指定 的 初始 值 。 该 信号 量 
的 sem_otime 值 保证 由 semget 初 始 化 为 0， 然 后 由 创建 者 的 semop 调 用 设 
置 成 某 个 非 零 值 。 这 样 一 来 ， 发 现 该 信号 量 已 经 存在 的 任何 其 他 线程 


一 旦 看 到 该 信号 量 的 sem_otime 值 不 为 0， 就 可 以 肯定 它 已 完成 初始 
化 。 

检查 初始 值 

407-44 我 们 检查 由 调用 者 指定 的 初始 值 ， 因 为 System V 信 号 量 通 
常 作 为 unsigned short 整 数 存放 ( 见 11.1 节 中 的 sem 结 构 ) ， 有 一 个 32767 
的 最 大 值 (11.777) ，Posix 信 号 量 则 通常 作为 普通 整数 存放 ， 人 允许 的 
值 可 能 更 大 (10.13 节 ) 。 有 些 System V 实 现 把 常 值 EMVMX 定 义 成 最 
大 的 信号 量 值 ， 如 果 系 统 没有 定义 该 常 值 ， 我 们 就 在 图 10-51 中 把 它 定 
义 为 32767 ° 

517-53 如 果 所 需 的 System V 信 号 量 已 经 存在 ， 而 且 调用 者 没有 指 
定 O_ EXCL, Abt NEE e 

这 种 情形 下 ， 代 码 将 落 入 用 于 打开 (而 不 是 创建 ) 已 存在 信号 量 
的 那 部 分 。 

图 10-53 给 出 了 我 们 的 sem_open 函 数 的 后 半 部 分 。 

打开 已 存在 的 信号 量 

55--63 对 于 已 存在 的 待 打 开 Posix 信 号 量 (调用 者 未 指定 O_CREAT 
标志 或 者 尽管 指定 了 该 标志 ， 但 所 需 信 号 量 已 存在 ) ， 我 们 使 用 semget 
打开 与 之 对 应 的 System V 信 和 号 量 。 注 意 ， 当 O_CREAT 标 志 未 指定 时 , 
sem_open 并 没有 mode 参 数 ， 然 而 即使 符 打 开 的 是 一 个 已 存在 的 信号 
=, semget 也 需要 一 个 与 mode 参 数 等 价 的 参数 e TEAR ERAI] FF AR ACE , 
RI] E s semflag IA T SPRUE (来 自我 们 的 unpipc.h 关 文件 的 
SVSEM_MODE 常 值 ) ， 它 在 调用 者 未 指定 O_CREAT 标 志 时 传递 给 
semget ° 

等 待 信号 量 完成 初始 化 

64~72 接着 通过 以 IPC_STAT 命 令 循 环 调用 semctl， 等 待 该 信号 量 
的 sem_otime 值 变 为 非 零 来 验证 它 已 初始 化 完毕 。 


my pxsem svsem/sem open.c 


55 /* 

56 * (O CREAT not secified) or 

57 * (O CREAT without O EXCL and semaphore already exists). 
58 * Must open semaphore and make certain it has been initialized. 
59 */ 

60 if ( (key = ftok(pathname, 0)) -- (key t) -1) 
61 goto err; 

62 if ( (semid = semget(key, 0, semflag)) -- -1) 
63 goto err; 

64 arg.buf - &seminfo; 

65 for (i = 0; i « MAX TRIES; i++) { 

66 if (semctl(semid, 0, IPC STAT, arg) -- -1) 
67 goto err; 

68 if (arg.buf-»sem otime !- 0) 

69 goto finish; 

70 sleep(1); 

rg 

72 errno = ETIMEDOUT; 

73 err: 

74 Save errno - errno; /* don't let semctl() change errno */ 
75 if (semid !- -1) 

76 semctl(semid, 0, IPC RMID); 

77 errno = save_errno; 

78 return (SEM_FAILED) ; 

79 finish: 

80 if ( (sem = malloc(sizeof(sem t))) == NULL) 

81 goto err; 

82 sem->sem_semid = semid; 

83 sem->sem_magic = SEM MAGIC; 

84 return (sem) ; 

85 ) 


my pxsem svsem/sem open.c 


图 10-53 sem openÉRZ&: 后 半 部 分 


出 错 返 回 

73~78 发 生 错 误 上 时， 我 们 小 心地 你 证 不 改变 errno 的 值 。 

分 配 sem_t 数 据 类 型 

79--84 为 一 个 sem_t 数 据 类 型 分 配 空间 ， 把 所 创建 或 打开 的 System 

V 信 和 号 量 的 ID 存放 到 该 结构 中 。 本 函 数 的 返回 值 承 是 指 癌 该 sm_t 数 据 

类 型 的 指针 。 

10.16.2 sem_close HA 

10-5424 Hi f dX] B Jsem. closeENZX, E (1X Vil H free Pa 76 73 
sem_t 数 据 类 型 动态 分 配 的 内 存 空间 。 


my pxsem svsem/sem close.c 


1 #include "unpipc.h" 
2 #include "Semaphore.h" 
3 int 
4 sem close(sem t *sem) 
5 { 
6 if (sem-»sem magic !- SEM MAGIC) { 
110-54 sem. closeR Zi 
7 errno - EINVAL; 
8 return(-1); 
9 ) 
10 sem-»sem magic = 0; /* just in case */ 
11 free (sem); 
12 return(0); 
13 } 


my pxsem svsem/sem close.c 


图 10-54 (4&) 

10.16.3 sem unlinkER2 

图 10-55 给 出 了 我 们 的 sem_unlink 函 数 ， 它 删除 与 我 们 的 某 个 Posix 
信和 号 量 关 联 的 辅助 文件 和 System V 信 号 量 。 


my pxsem svsem/sem unlink.c 


1 #include "unpipc.h" 

2 #include "Semaphore .hn 

3 int 

4 sem unlink(const char *pathname) 

5 { 

6 int semid; 

7 key t key; 

8 if ( (key - ftok(pathname, 1)) -- (key t) -1) 
9 return (-1) ; 

10 if (unlink(pathname) == -1) 

11 return (-1) ; 
12 if ( (semid = semget (key, 1, SVSEM MODE)) == -1) 
13 return (-1) ; 
14 if (semctl(semid, 0, IPC_RMID) == -1) 
15 return (-1); 
16 return (0) ; 
17 3 


my pxsem svsem/sem unlink.c 


图 10-55 sem_unlink iK AY 


获取 与 路 径 名 关联 的 System V 键 


8 一 16 ftok 把 调用 者 指定 的 路 径 名 转换 成 一 个 System V IPC 键 。 
unlink 函 数 删 除 与 该 路 径 名 同名 的 辅助 文件 。 (我 们 现在 就 删除 该 文 
件 ， 这 样 可 避免 另外 某 个 函数 返回 一 个 错误 。 [7Z] ) semget 打 开关 联 的 
System V 信 号 量 ， 接 着 由 semctl 的 IPC_RMID 命 令 删 除 该 信号 量 。 

10.16.4 sem. post K Š% 

图 10-56 给 出 了 我 们 的 sem_post 函 数 ， 它 会 给 某 个 信号 量 的 值 加 1。 

117-16 以 单一 操作 调用 semop ， 把 由 调用 者 指定 的 信号 量 的 值 加 


my pxsem svsem/sem post.c 


1 #include "unpipc.h" 


2 #include "semaphore.h" 

3 int 

4 sem post (sem t *sem) 

5 { 

6 struct sembuf op; 

7 if (sem->sem magic != SEM_MAGIC) { 
8 errno = EINVAL; 

9 return (-1); 

10 } 

1i op.sem num - 0; 

12 op.sem op - 1; 

13 op.sem flg - 0; 

14 if (semop(sem->sem_semid, &op, 1) < 0) 
15 return (-1); 

16 return (0); 

19755 


my pxsem svsem/sem post.c 


图 10-56 sem_post EN Zi 


10.16.5 sem_wait HY 
图 10-57 给 出 了 我 们 的 sem_wait 函 数 ， 它 等 待 基 个 信号 量 的 值 超过 


my pxsem svsem/sem wait.c 


1 #include "unpipc.h" 

2 #include "semaphore.h" 

3 int 

4 sem wait(sem t *sem) 

5 { 

6 struct sembuf op; 

7 if (sem-»sem magic != SEM MAGIC) { 
8 errno - EINVAL; 

9 return (-1) ; 

10 } 

TA op.sem num = 0; 

12 op.sem op = -1; 

13 op.sem flg - 0; 

14 if (semop(sem-»sem semid, &op, 1) < 0) 
15 return (-1) ; 

16 return (0) ; 

17 


my pxsem svsem/sem wait.c 


图 10-57 sem_wait KAY 


11-16 以 单一 操作 调用 semop ， 把 由 调用 者 指定 的 信号 量 的 值 城 


10.16.6 sem_trywait HAL 
图 10-58 给 出 了 我 们 的 sem_trywait 函 数 ， 它 是 sem_wait 函 数 的 非 阻 
SEU ° 
13 与 图 10-57 中 sem_wait 函 数 的 唯一 差别 是 把 sem_ftg 成 员 指定 为 
IPC_NOWAIT。 如 果 不 阻塞 调用 成 程 就 完成 不 了 所 指定 的 操作 | 那么 
semop 的 返回 值 将 是 EAGAIN 钳 误 ， 这 也 是 sem_trywait 非 得 阻塞 才能 完 
等 竺 操作 时 必须 返回 的 错误 。 


my pxsem svsem/sem trywailt.c 


my pxsem svsem/sem trywailt.c 


1 #include "unpipc.h" 
2 #include "semaphore.h" 
3 int 
4 sem trywait(sem t *sem) 
5 { 
6 struct sembuf Op; 
7 if (sem-»sem magic !- SEM MAGIC) { 
8 errno - EINVAL; 
9 return(-1); 
10 } 
11 op.sem_num = 0; 
12 op.sem_op = -1; 
13 op.sem flg - IPC NOWAIT; 
14 if (semop(sem->sem_semid, &op, 1) < 0) 
15 return(-1); 
16 return(0); 
17 3 
图 10-58 sem_trywait HAY 
10.16.7 sem_getvalue K% 


图 10-59 给 出 了 我 们 的 最 后 一 个 函数 sem_getvalue， 它 返回 某 个 信号 


量 的 当前 值 。 


一 


1 #include "unpipc.h" 
2 #include "semaphore.h" 
3 int 


4 sem_getvalue(sem_t *sem, int *pvalue) 


5 { 


6 int val; 

7 if (sem->sem_magic != SEM MAGIC) { 

8 errno = EINVAL; 

9 return (-1) ; 

10 } 

11 if ( (val = semctl(sem-»sem semid, 0, GETVAL)) < 0) 
12 return (-1) ; 

13 *pvalue = val; 

14 return (0) ; 

15 } 


图 10-59 sem. getvalueEk Zi 


my pxsem svsem/sem getvalue.c 


my pxsem svsem/sem getvalue.c 


117-14 由 调用 者 指定 的 信号 量 的 当前 值 使 用 semctl 的 GETVAL 命 令 


获取 。 


10.17 人 小结 


Posix 信 号 量 是 计数 信号 量 ， 它 提供 以 下 三 种 基本 操作 : 

(1) 创 建 一 个 信号 量 ; 

(2) 等 待 一 个 信号 量 的 值 变 为 大 于 0， 然 后 将 它 的 值 减 1; 

(3) 给 一 个 信号 量 的 值 加 1， 并 唤醒 等 待 该 信号 量 的 任意 线程 ， 以 此 
挂 出 该 信号 量 。 

Posix 信 和 号 量 可 以 征 有 名 的 ， 也 可 以 是 基于 内 存 的 。 有 名 信和 号 量 总 
征 能 够 在 不 同 进程 间 共 享 ， 基 于 内 存 的 信号 量 则 必须 在 创建 时 指定 成 
是 否 在 进程 间 共 享 。 这 两 类 信号 量 的 持续 性 也 有 差别 : 有 名 信和 号 量 至 
少 有 随 内 核 的 持续 性 ， 基 于 内 存 的 信号 量 则 具有 随 进 程 的 持续 性 。 

生产 者 -消费 者 问题 是 演示 信和 号 量 的 经 典 例子 。 本 章 中 ， 解 决 这 个 
问题 的 第 一 个 方案 只 有 一 个 生产 者 线程 和 一 个 消费 者 线程 ， 下 一 个 方 
案 人 允许 多 个 生产 者 线程 和 单个 消费 者 线程 ， 最 后 一 个 方案 则 允许 多 个 
消费 者 线程 。 我 们 接着 指出 ， 双 缓冲 这 个 经 典 问题 仅仅 是 生产 者 -消费 
者 问题 的 一 个 特例 ， 该 问题 涉及 的 生产 者 和 请 费 痢 都 是 单个 的 。 

本 章 最 后 提供 了 Posix 信 号 量 的 三 种 示例 实现 。 使 用 FIFO 完 成 的 第 
一 种 实现 是 最 简单 的 ， 因 为 内 核 提供 的 read 和 write 芳 数 处 理 了 不 少 同步 
需求 。 第 二 种 实现 使 用 内 存 映 射 WO 完 成 ， 这 与 5.8 广 中 提供 的 Posix 消 费 
队列 的 实现 类 似 ， 其 中 的 同步 使 用 互 斤 锁 和 条 件 变量 进行 。 最 后 一 种 
实现 使 用 System V 信 号 量 完成 ， 它 同时 提供 了 访问 System V 信 和 号 量 的 一 
个 更 简单 的 接口 。 


习题 


10.1 40 F162 10.6 T FA produce# consume AL o E55, WHER Bt 
者 程序 中 两 个 Sem_wait 的 顺序 以 引发 死 锁 (1E AI10.6 5 Fite ay BB 
FE) 。 其 次 ， 在 每 个 Sem_wait 调 用 之 前 加 一 个 printf 调 用 ， 以 指出 哪个 


线程 〈 生 产 者 或 消费 者 ) 在 等 待 哪个 信号 量 。 在 这 些 Sem_wait 调 用 之 
后 再 加 一 个 printf 调 用 ， 以 指出 取得 了 相应 信号 量 的 线程 。 把 缓冲 区 的 
数目 减少 到 2， 然 后 构造 并 运行 该 程序 ， 以 验证 它 会 导致 死 锁 。 
10.2 假设 启动 图 9-2 中 的 程序 的 4 个 副本 ， 而 该 程序 调用 的 my_lock 
函数 来 目 图 10-19: 
% lockpxsem & lockpxsem & lockpxsem & lockpxsem & 
这 4 个 进程 都 以 值 为 0 的 initflag 局 动 ， 因 此 每 个 进程 调用 sem_open 
时 都 指定 了 O_CREAT 标 志 。 这 样 可 行 吗 ? 
10.3 上 一 道 习题 中 ， 要 是 有 一 个 进程 在 调用 my_lock 之 后 但 在 调用 
my_unlock 之 前 终止 ， 那 么 会 发 生 什 么 ? 
10.4 在 图 10-37 中 ， 要 是 我 们 没有 把 那 两 个 描述 符 都 初始 化 为 -1， 
那么 会 发 生 什 么 ? 
10.5 在 图 10-37 中 ， 我 们 为 什么 先 保存 errno 的 值 ， 稍 后 再 恢复 ， 而 
不 是 把 那 两 个 close 调 用 改 为 : 
if (sem-»fd[0] >= 0) 
close(sem->fd[0]); 
if (sem->fd[1] >= 0) 
close(sem->fd[1]); 
10.6 如 采 有 两 个 进程 几乎 同时 调用 我 们 的 sem_open 的 FIFO 实 现 版 
本 (图 10-37) ， 而 且 都 指定 O_CREAT 标 志和 初始 值 5， 那 么 会 发 生 什 
A? 相应 的 FIFO 有 可 能 被 (不 正确 地 ) 初始 化 为 10 吗 ? 
10.7 对 于 图 10-43 和 图 10-44， 我 们 描述 过 当 有 两 个 进程 几乎 同时 和 
试 创建 一 个 信号 量 时 可 能 存在 的 一 种 竞争 状态 。 然 而 在 上 一 道 习 题 的 
解答 中 ， 我 们 说 图 10-37 不 存在 竞争 状态 。 请 解释 。 
10.8 Posix.1 规 定 了 sem_wait 的 一 个 可 选 功能 : 检测 目 己 已 被 一 个 捕 
获 的 信号 中 断 并 返回 EINTR 错 误 。 编 写 一 个 测试 程序 ， 判 定 你 的 系统 
上 的 实现 是 否 进行 这 种 检测 。 


再 针对 我 们 的 几 种 实现 运行 你 的 测试 程序 ， 它 们 有 使 用 FIFO 的 
(10.14 节 ) 、 使 用 内 存 映射 VO 的 (10.15 节 ) 和 使 用 System V 信 号 量 的 
(10.16 节 ) 。 

10.9 我 们 的 3 种 sem_post 实 现 中 ， 哪 种 是 异步 信号 安全 的 (图 5- 
10) ? 

10.10 修改 10.6 节 中 使 用 的 生产 者 -消费 者 解决 方案 ， 将 mutex 变 量 
改 为 使 用 pthread_mnutex_t 数 据 类 型 ， 而 不 是 使 用 信号 量 。 在 性 能 上 发 生 
了 可 测量 到 的 变化 了 吗 ? 

10.11 比较 有 名 信号 量 (图 10-17 和 图 10-18) 和 基于 内 存 的 信号 量 
(图 10-20) 的 定时 结果 。 


第 11 章 System V 信 号 量 


11.1 概述 


我 们 在 第 10 章 中 讲述 信号 量 的 概念 时 ， 首 先 讨 论 的 是 

二 值 信号 量 (binary semaphore) : 其 值 或 为 0 或 为 1 的 信号 量 。 这 
与 互 斥 锁 (第 7 章 ) 类 似 ， 若 资源 被 锁 住 则 信号 量 值 为 0， 若 资源 可 用 
则 信号 量 值 为 1。 

接着 把 这 种 信号 量 扩展 为 

计数 信号 量 (counting semaphore) : 其 值 在 0O 和 某 个 限制 值 (对 于 
Posix 信 号 量 ， 该 值 必须 至 少 为 32767) 之 间 的 信号 量 。 我 们 使 用 这 些 信 
号 量 在 生产 者 -消费 者 问题 中 统计 资源 ， 信 号 量 的 值 就 是 可 用 资源 数 。 

这 两 种 类 型 的 信号 量 中 ， 等 待 (wait) 操作 都 等 待 信号 量 的 值 变 为 
大 于 0， 然 后 将 它 减 1。 挂 出 (post) 操作 则 只 是 将 信号 量 的 值 加 1， 从 
而 唤醒 正在 等 待 该 信号 量 值 变 为 大 于 0 的 任意 线程 。 


System V 信 号 量 通 过 定义 如 下 概念 给 信号 量 增加 了 另外 一 级 复杂 
度 o 
? 计数 信号 量 集 (set of counting semaphores) : 一 个 或 多 个 信号 量 
(构成 一 个 集合 ) ， 其 中 每 个 都 是 计数 信号 量 。 每 个 集合 的 信号 量 数 
存在 一 个 限制 ， 一 般 在 25 个 的 数量 级 上 (11.7 节 ) 。 当 我 们 谈论 
“System V 信 号 量 * 时 ， 所 指 的 是 计数 信号 量 集 。 当 我 们 谈论 “Posix 信 号 
量 ”" 时 ， 所 指 的 是 单个 计数 信号 量 。 
对 于 系统 中 的 每 个 信号 量 集 ， 内 核 维护 一 个 如 下 的 信息 结构 ， 它 
定义 在 <sys/sem.h> 头 文件 中 。 


struct semid ds ( 


Struct ipc_perm sem perm; /* operation permission struct */ 

struct sem *sem base; /* ptr to array of semaphores in 
set */ 

ushort sem nsems;  /* #of semaphores in set */ 

time t sem otime;  /* time of last semop()*/ 

time t sem ctime; /* time of creation or last 
IPC SET */ 

b 


HP Wipe permZifg1E3.3 T fX, CaaS BUDUT TIERE aS 
量 的 访问 权限 。 

sem 结 构 是 内 核 用 于 维护 某 个 给 定 信号 量 的 一 组 值 的 内 部 数据 结 
构 。 一 个 信和 号 量 集 的 每 个 成 员 由 如 下 这 个 结构 描述 ; 


struct sem ( 


ushort t semval; /* semaphore value,nonnegative */ 
short sempid; /* PID of last successful 
semop(),SETVAL,SETALL */ 


ushort_t semncnt; /* # awaiting semval > current value */ 


ushort t semzcnt; /* # awaiting semval = 0 */ 

H 

注意 sem_base 含 有 指向 某 个 sem 结 构 数 组 的 指针 : 当前 信号 量 集中 
的 每 个 信号 量 对 应 其 中 一 个 数组 元 素 。 

除 维护 一 个 信号 量 集 内 每 个 信号 量 的 实际 值 之 外 ， 内 核 还 给 该 集 
合 中 每 个 信号 量 维护 另外 三 个 信息 : 对 其 值 执行 最 后 一 次 操作 的 进程 
的 进程 ID、 等 待 其 值 增长 的 进程 数 计 数 以 及 等 待 其 值 变 为 0 的 进程 数 计 
TW o 


Unix 98 声 称 上 述 这 个 结构 是 匿名 的 。 我 们 给 出 的 名 字 sem 来 目 历史 
上 的 System V 实 现 。 

我 们 可 以 把 内 核 中 的 某 个 特定 信号 量 图 解 成 指向 一 个 sem 结 构 数 组 
的 一 个 semid_ds 结 构 。 如 采 该 信号 量 在 其 集合 中 有 两 个 成 员 ， 那 么 我 们 
将 有 图 11-1 所 示 的 图 解 。 该 图 中 变量 sem_nsems 的 值 为 2， 男 外 该 集合 
的 两 个 成 员 分 别 用 下 标 [0] 和 [1] 标 记 。 


semid dst{} 


] 
semzcnt [1] 


| | 
言 号 量 | 
| "a A » semval [0] 1 
l "VATI | 
I : sempid[0] | 
| ipc permí) mp vestri 
! : 
; l 
i | 
| : 
sempic [1] | 
| | 
| ， | 
: | 
; 1 
; | 


图 11-1 由 两 组 值 构成 的 某 个 信号 量 集 的 内 核 数据 结构 


11.2 semget EN ži 


semget 芳 数 创 建 一 个 信号 量 集 或 访问 一 个 已 存在 的 信号 量 集 。 

#include <sys/sem.h> 

int semget(key t key,int nsems,int oflag); 

返回 : ERDUK RENK, AEEA- 

返回 值 是 一 个 称 为 信号 量 标识 符 (semaphore identifier) 的 整数 ， 
semop 和 semct 函 数 将 使 用 它 。 

nsems 人 参数 指定 集合 中 的 如 果 我 们 不 创建 一 个 新 的 信和 号 
量 集 ， 而 只 是 访问 一 个 已 存在 的 集合 ， 那 就 可 以 把 该 参数 指定 为 0。 
旦 创建 完 一 个 信号 量 集 ， 我 们 就 不 外 改变 其 中 的 Hi 

oflag 值 是 图 3-6 中 给 出 的 SEM_R 和 SEM_A 常 值 的 组 合 。 其 中 R 代 表 
“i (read)  ”，A 代 表 “ 改 (alter) ”。 它 们 还 可 以 与 IPC_CREAT 或 
IPC_CREAT | IPC_EXCL 按 位 或 ， 如 随 图 3-4 所 作 的 讨论 。 

当 实 际 操作 为 创建 一 个 新 的 信号 量 集 时 ， 相 应 的 semid_ds 结 构 的 以 
下 成 员 将 被 初始 化 。 

sem_perm 结 构 的 uid 和 cuid 成 员 被 置 为 调用 进程 的 有 效用 户 ID gid 
和 cgid 成 员 被 置 为 调用 进程 的 有 效 组 ID 。 

oflag 参 数 中 的 读 写 权 限 位 存 入 sem_perm.mode 。 

sem_otime 被 置 为 0，sem_ctime 则 被 置 为 当前 时 间 。 

sem_nsems 被 置 为 nsems 参 数 的 值 。 

与 该 集合 中 每 个 信号 量 关 联 的 各 个 sem 结 构 并 不 初始 化 。 这 些 结构 
是 在 以 SET_VAL 或 SETALL 命 令 调 用 semctl 时 初始 化 的 。 

信和 号 量 值 的 初始 化 

出 现在 本 书 1990 年 版 所 合 源 代码 中 的 注释 不 正确 地 声称 ， 当 实际 
操作 为 创建 一 个 新 的 信号 量 集 时 ，semget 会 将 该 集合 中 各 个 信号 量 的 值 
初始 化 为 0。 尽 管 有 些 系统 确实 把 新 的 信号 量 集 内 各 个 信号 量 的 人 初始 
化 为 0， 这 一 点 却 不 能 保证 做 到 。 实 际 上 早期 的 System V 实 现 根本 不 对 


言 号 量 值 进行 初始 化 ， 存 放 新 创建 信号 量 集 的 那 部 分 内 存 空间 最 近 一 
次 使 用 时 的 值 束 是 各 个 信号 量 的 初始 值 。 

semget 的 大 多 数 手册 页 面 根本 不 就 实际 操作 为 创建 一 个 新 的 信号 量 
集 时 各 个 信号 量 的 初始 值 应 为 多 少 说 些 什 么 。X/Open XPG3 可 移植 性 
指南 (1989 年 ) 和 Unix 98 纠 正 了 这 个 忽略 行为 ， 明 确 地 陈述 semget 并 
不 初始 化 各 个 信号 量 的 值 ， 这 个 初始 化 必须 通过 以 SET_VAL 命 令 ( 设 
HG 个 值 ) 或 SETALL 命 令 〈 设 置 集 合 中 所 有 值 ) 调用 semctl 

(我 们 稍 后 描述 ) 来 完成 。 

System V 信 号 量 的 设计 中 ， 创 建 一 个 信号 量 集 (semget) 并 将 它 初 
Att (semctl) 需 两 次 函数 调用 是 一 个 致命 的 缺陷 。 一 个 不 完备 的 解决 
方案 是 : 在 调用 semget 时 指定 IPC_CREAT |IPC_EXCL 标 志 ， 这 样 只 有 
一 个 进程 (首先 调用 semget 的 那个 进程 ， 创 建 所 需 信号 量 ， 该 进程 随后 
初始 化 该 信号 量 ， 其 他 进程 会 收 到 来 自 semget 的 一 个 EEXIST 错 误 ， 于 
是 再 次 调用 semget， 不 过 这 次 调用 既 不 指定 IPC_CREAT 标 志 ， 也 不 指 
定 IPC_EXCL 标 志 。 

然而 竞争 状态 依然 存在 。 假 设 有 两 个 进程 几乎 同时 党 试 创建 并 初 
台 化 一 个 只 有 单个 成 员 的 信号 量 集 ， 两 者 都 执行 如 下 儿 行 标 了 号 的 代 
码 : 

1  oflag = IPC CREAT |IPC EXCL | SVSEM_MODE; 

2 if ( (semid = semget(key,1,oflag))>= 0){ 


/* success,we are the first,so initialize */ 
3 arg.val 7 1; 
4 Semctl(semid,0,SETVAL, arg); 
5 } else if (errno == EEXIST){ 
/* already exists,just open */ 
6 semid = Semget(key,1,SVSEM_MODE); 
7 } else 


8 err sys("semget error"); 

9 Semop(semid,...); /* decrement the semaphore by 1 */ 

那么 可 能 发 生 如 下 情形 ; 

() 第 一 个 进程 执行 第 1~3 行 ， 然 后 被 内 核 阻止 执行 ; 

(2) 内 核 启 动 第 二 个 进程 ， 它 执行 第 1、2、5、6、9 行 。 

尽管 成 功 创建 该 信号 量 的 第 一 个 进程 将 是 初始 化 该 信号 量 的 唯一 
进程 ， 但 是 由 于 它 完 成 创建 和 初始 化 操作 需 花 两 个 步 又， 因此 内 核 有 
可 能 在 这 两 个 步骤 之 间 把 上 下 文 切换 到 另 一 个 进程 。 这 个 新 切换 来 运 
行 的 进程 随后 可 以 使 用 该 信号 量 《上述 代 码 片段 的 第 9 行 ) ， 但 是 该 信 
号 量 的 值 尚未 由 第 一 个 进程 初始 化 。 当 第 二 个 进程 执行 第 9 行 时 ， 该 信 
号 量 的 值 是 不 确定 的 。 

邓 运 的 是 存在 绕 过 这 个 竞争 状态 的 方法 。 当 semget 创 建 一 个 新 的 信 
号 量 集 时 ， 其 semid_ds 结 构 的 sem_otime 成 员 保证 被 置 为 0。 (System V 
手册 已 陈述 这 个 事实 很 长 时 间 ，XPG3 和 Unix 98 标 准 也 这 么 说 。) 该 成 
员 只 是 在 semop 调 用 成 功 时 才 被 设置 为 当前 值 。 因 此 ， 上 面 例子 中 的 第 
二 个 进程 再 次 成 功 地 调用 semget (上 述 代码 请 段 的 第 6 行 ) 后 ， 必 须 以 
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可 断定 该 信号 量 已 被 初始 化 ， 而 且 对 它 进 行 初始 化 的 那个 进程 已 成 功 
地 调用 semop。 这 意味 着 创建 该 信号 量 的 那个 进程 必须 初始 化 它 的 值 ， 
而 且 必 须 在 任何 其 他 进程 可 以 使 用 该 信号 量 之 前 调用 semop。 我 们 在 图 
10-52 和 图 11-7 中 展示 了 使 用 这 种 技巧 的 例子 。 

Posix 有 名 信和 号 量 通过 让 单个 函数 (sem open) 创建 并 初始 化 信号 
量 来 避免 上 述 问 题 。 而 且 即 使 指定 O_CREAT 标 志 ， 信 号 量 也 只 是 在 尚 
未 存在 的 前 所 下 才 被 初始 化 。 

这 个 潜在 的 竞争 状态 是 否 构成 问题 还 取决 于 应 用 程序 。 有 些 应 用 
程序 (例如 图 10-21 中 的 生产 者 一 消费 者 程序 ) 由 单个 进程 创建 并 初始 
化 信号 量 。 这 种 情形 下 不 会 存在 竞争 状态 。 但 是 在 其 他 应 用 程序 ( 例 


如 图 10-19 中 的 文件 上 尔 例 子 程序 中， 创建 并 初始 化 信号 量 的 并 不 是 
单个 进程 : 第 一 个 打开 信和 号 量 的 进程 必须 创建 并 初始 化 它 ， 而 且 必 须 
WER TET ° 


11.3 semop EAR 


使 用 semget 打 开 一 个 信号 量 集 后 ， 对 其 中 一 个 或 多 个 信号 量 的 操作 
就 使 用 semop 函 数 来 执行 。 
#include <sys/sem.h> 
int semop(int semid,struct sembuf *opsptr,size_t nops); 
返回 : ERDUK, AEEA- 
其 中 opsptr 指 同一 个 如 下 结构 的 数组 : 


struct sembuf { 


short sem num; /* semaphore number: 0,1,...,nsems-1 */ 

short sem Op; /* semaphore operation: <0,0,>0 */ 

short sem flg; /* operation flags: 
O,JIPC NOWAIT,SEM UNDO */ 


H 
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组 中 的 每 个 元 素 给 目标 信号 量 集 内 某 个 特定 的 信号 量 指定 一 个 操作 。 
这 个 特定 的 信号 量 由 sem_num 指 定 ，0 代 表 第 一 个 元 素 ，1 代 表 第 二 个 
元 素 ， 依 次 类 推 ， 直 到 nsems-1， 其 中 nsems 是 目标 信号 量 集 内 成 员 信和 号 
量 的 数目 (也 就 是 创建 该 集合 时 传递 给 semget 的 第 二 个 参数 ) 。 

我 们 仅仅 保证 sembuf 结 构 含 有 所 给 出 的 三 个 成 员 。 它 还 可 能 含有 
其 他 成 员 ， 而 且 各 成 员 并 不 保证 以 我 们 给 出 的 顺序 排序 。 这 意味 着 我 
们 绝 不 能 静态 地 初始 化 这 种 结构 ， 例 如 : 


struct sembuf ops[2] = 1 


0,0,0， /* wait for [0] to be 0 */ 
0,1,SEM UNDO /* then increment [0] by 1 */ 

}; 
而 是 必须 使 用 运行 时 初始 化 方法 ， 例 如 : 

struct sembuf ops[2]; 

ops[0].sem num = 0; /* wait for [0] to be 0 */ 

ops[0].sem op = 0; 

ops[0].sem flg = 0; 

ops[1].sem num = 0; /* then increment [0] by 1 */ 

ops[1].sem op = 1; 

ops[1].sem flg - SEM. UNDO; 

由 内 核 保 证 传递 给 semop 函 数 的 操作 数组 (opsptr) 被 原子 地 执 
行 。 内 核 或 者 完成 所 有 指定 的 操作 ， 或 者 什么 操作 都 不 做 。 我 们 将 在 
11.5 方 中 给 出 这 个 特性 的 一 个 例子 。 

每 个 特定 的 操作 是 由 sem_op 的 值 确定 的 ， 它 可 以 是 负数 、0 或 正 
数 。 在 稍 后 给 出 的 讨论 中 ， 我 们 将 使 用 如 下 术语 。 

semval: 信号 量 的 当前 值 (图 11-1) 

semncnt: 等 待 smval 变 为 大 于 其 当前 值 的 线程 数 (图 11-1) 

semzcnt: 等 待 semval 变 为 0 的 线程 数 (图 11-1) 

semadj: 所 指定 信号 量 针 对 调用 进程 的 调整 值 。 只 有 在 对 应 本 操作 
的 sembuf 结 构 的 sem_flg 成 员 中 指定 SEM_UNDO 标 志 后 ，semadj 才 会 更 
新 。 这 是 一 个 概念 性 的 变量 ， 它 由 内 核 为 在 其 某 个 信号 量 操作 中 指定 
了 SEM_UNDO 标 志 的 各 个 进程 维护 ， 不 必 存 在 名 为 smadj 的 结构 成 
me [8] 

使 得 一 个 给 定 信 号 量 操 作 非 阻塞 的 方法 是 ， 在 对 应 的 sembuf 结 构 
的 sem_flg 成 员 中 指定 IPC_NOWAIT 标 志 。 在 指定 了 该 标志 ， 并 且 如 果 


不 把 调用 线程 投入 睡眠 就 完成 不 了 这 个 给 定 操 作 的 情况 下 ，semop 将 返 
回 一 个 EAGAIN 错 误 。 

当 一 个 线程 被 投入 睡眠 以 等 待 某 个 信号 量 操作 完成 之 时 (我 们 将 
看 到 该 线程 既 可 等 待 这 个 信号 量 的 值 变 为 0， 也 可 等 得 它 变 为 大 于 
0) ， 如 果 它 捕获 了 一 个 信和 号， 那么 其 信号 处 理 程序 的 返回 将 中 断 引 起 
睡眠 的 semop 函 数 ， 该 函数 于 是 返回 一 个 EINTR 错 误 。 按 照 UNPvVl 第 124 
页 的 术语 定义 ，semop 是 需 被 所 捕获 的 信号 中 断 的 慢 系统 调用 (slow 
system call) 。 

当 一 个 线程 被 投入 睡眠 以 等 竺 某 个 信号 量 操作 完成 之 时 ， 如 宁 该 
信和 号 量 被 男 外 某 个 线程 或 进程 从 系统 中 删除 ， 那 么 引起 睡眠 的 semop 函 
数 将 返回 一 个 EIDRM 错 误 ， 表 示 “identifier removed (ERA ff 2 JI 
除 ) ”。 

现在 我 们 基于 每 个 具体 指定 的 sem_op 操 作 的 三 类 可 能 值 一 一 正 
数 、0 或 负数 一 来 描述 semop 的 操作 。 

(1)ZlZEsem opzéiEZ&, HARI £lsemval 上 。 这 对 应 于 释放 由 某 
个 信号 量 控制 的 资源 。 

如 果 指 定 了 SEM_UNDO 标 志 ， 那 束 从 相应 信号 量 的 semadj 值 中 减 
掉 sem_op 的 值 。 

(2) 如 果 sem_op 是 0， 那 么 调用 者 希望 等 得 到 semval 变 为 0。 如果 
semval 已 经 是 0， 那 就 立即 返回 。 

如 采 semval 不 为 0， 相 应 信号 量 的 semzcnt 值 束 加 1， 调 用 线程 则 被 
阻塞 到 semval 变 为 0 (到 那 时 ， 相 应 信号 量 的 semzcnt 值 再 减 1) 。 前面 
已 经 提 到 ， 如 果 指 定 了 IPC_NOWAIT 标 志 ， 调 用 线程 就 不 会 被 投入 睡 
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言 号 量 被 删除 了 ， 那 么 该 函数 将 过 早 地 返回 一 个 错误 。 

(G) 如 果 sem_op 是 负数 ， 那 么 调用 者 硕 望 等 待 semval 变 为 大 于 或 等 
于 sem_op 的 绝对 值 。 这 对 应 于 分 配 资源 。 


如 果 semval 大 于 或 等 于 sem_op 的 绝对 值 ， 那 就 从 semval 中 减 挥 
sem_op 的 绝对 值 。 如 果 指 定 了 SEM_UNDO 标 志 ， 那 么 gem_op 的 绝对 值 
残 加 到 相应 信号 量 的 semadj 值 上 。 

如 采 semval 小 于 sem_op 的 绝对 值 ， 相 应 信号 量 的 semncnt 值 承 加 1 , 
调用 线程 则 被 阻塞 到 semval 变 为 大 于 或 等 于 sem_op 的 绝对 值 。 到 那 时 
该 线程 将 被 解 阻 塞 ， 还 将 从 semval 中 减 掉 sem_op 的 绝对 值 ， 相 应 信和 号 
量 的 semncnt 值 将 减 1。 如 果 指 定 了 SEM_UNDO 标 志 ， 那 么 sem_op 的 绝 
对 值 将 加 到 相应 信号 量 的 semadj 值 上 上。 前面 已 经 提 到 ， 如 果 指 定 了 
IPC_NOWAIT 标 志 ， 调 用 线程 整 不 会 修 投 入 睡眠 。 男 外 ， 如 末 某 个 被 
捕获 的 信号 中 断 了 3 引起 睡眠 的 sem_op 范 数 ， 或 者 相应 的 信号 量 被 删除 
了 ， 那 么 该 函数 将 过 早 地 返回 一 个 错误 。 

比较 一 下 这 些 操 作 和 Posix 信 和 号 量 允 许 的 操作 ， 可 看 到 Posix 信 和 号 量 
只 允许 -1 (sem wait) 和 +1 (sem post 这 两 个 操作 。System V 信 号 量 
允许 信号 量 的 值 增长 或 减少 不 光 是 1， 而 且 人 允许 等 每 信号 量 的 值 变 为 
0。 与 较为 简单 的 Posix 信 号 量 相 比 ， 这 些 更 为 一 般 化 的 操作 以 及 System 
V 信 号 量 可 以 有 一 组 值 的 事实 造成 了 System V 信 号 量 的 复杂 性 。 


11.4 semctl HAN 


semct 函 数 对 一 个 信号 量 执行 各 种 控制 操作 。 
#include <sys/sem.h> 
in.semctl(in.semid,in.semnum,in.cmd,.../.unio.semu.ar.*.); 
返回 : 者 成 功 则 为 非 负 值 〈《 见 正文 ) ， 大 出错 则 
HA 
第 一 个 参数 semid 标 识 其 操作 待 控制 的 信号 量 集 ， 第 二 个 参数 
semnum 标 识 该 信号 量 集 内 的 某 个 成 员 (0、1 等 ， 直 到 nsems-1) 


semnum 值 仅仅 用 于 GETVAL ` SETVAL ` GETNCNT 、GETZCNT 和 
GETPID 命 令 。 

第 四 个 参数 是 可 选 的 ， 取 决 于 第 三 个 参数 cmd 〈 参 见 下 面 给 出 的 联 
合 中 的 注释 ) 。 


union semun { 


int val; /* used for SETVAL only */ 

struct semid ds *buf; /* used for IPC SET and IPC STAT */ 

ushort *array; /* used for GETALL and SETALL */ 
$5 


这 个 联合 并 没有 出 现在 任何 系统 头 文 件 中 ， 因 而 必须 由 应 用 程序 
声明 。 (我 们 在 图 C.1 中 给 出 的 unpipch 头 文件 中 定义 了 它 。) 它 是 按 
值 传递 的 ， 而 不 是 按 引用 传递 的 。 也 丈 是 说 作为 参数 的 是 这 个 联合 的 
真正 值 ， 而 不 是 指 癌 它 的 指针 。 

NN, ALA (FreeBSD#lLinux) 在 <sys/sem.h> 头 文件 中 
定义 了 这 个 联合 ， 从 而 使 编写 可 移植 代码 变 得 困难 。 尽 管 由 这 个 系统 
头 文件 来 声明 semun 联 合 确实 有 理由 ，Unix 98 还 是 声称 它 必 须 由 应 用 程 
序 显 式 声 明 。 

System V 文 持 下 列 cmd 值 。 除 非 男 外 声明 ， 否 则 返回 值 为 0 表示 成 
功 ， 返 回 值 为 -1 表示 出 错 。 

GETVAL 把 semval 的 当前 值 作为 鸟 数 返 回 值 返回 。 既 然 信号 量 决 
不 会 是 负数 (semval 被 声明 成 一 个 unsigned short 整 数 ) ， 那 么 成 功 的 返 
回 值 总 是 非 负 数 。 

SETVAL 把 semval 值 设置 为 arg.val。 如 果 操 作成 功 ， 那 么 相应 信号 
量 在 所 有 进程 中 的 信号 量 调整 值 (semadj) 将 被 置 为 0。 

GETPID 把 sempid 的 当前 值 作为 贸 数 返 回 值 返 回 。 

GETNCNT 把 semncnt 的 当前 值 作 为 函数 返回 值 返 回 。 

GETZCNT 把 semzcnt 隐 当前 值 作为 函数 返回 值 返回 。 


GETALL 返回 所 指定 信号 量 集 内 每 个 成 员 的 semval 值 。 这 些 值 通 
过 arg.array 指 针 返 回 ， 范 数 本 和 吴 的 返回 值 则 为 0。 注意 ， 调 用 者 必须 分 
配 一 个 unsigned short 整 数 数 组 ， 该 数组 要 足够 容纳 所 指定 信号 量 集 内 所 
有 成 员 的 semval 值 的 ， 然 后 把 arg.array 设 置 成 指 辣 这 个 数组 。 

SETALL 设置 所 指定 信号 量 集中 每 个 成 员 的 semval 值 。 这 些 信 是 通 
过 arg.array 指 针 指 定 的 。 

IPC RMID 把 由 semid 指 定 的 信号 量 集 从 系统 中 删除 挥 。 

IPC SET 设置 所 指定 信号 量 集 的 semid_ds 结 构 中 的 以 下 三 个 成 员 : 
sem_perm.uid、sem_perm.gid 和 sem_perm.mode ， 这 些 值 来 自由 arg.buf 
参数 指 回 的 结构 中 的 相应 成 员 。semid_ds 结 构 中 的 sem_ctime 成 员 也 被 
设置 成 当前 时 间 。 

IPC STAT (通过 arg.buf 参数 ) 返回 所 指定 信号 量 集 当前 的 
semid_ds 结 构 。 注 意 ， 调 用 者 必须 首先 分 配 一 个 semid_ds 结 构 ， 并 把 
arg.buf 设置 成 指 癌 这 个 结构 。 


11.5 简单 的 程序 


既然 System V 信 号 量具 有 随 内 核 的 持续 性 ， 于 是 我 们 可 以 通过 编 
写 一 组 操纵 它们 的 程序 并 查看 这 些 程序 的 运行 结果 来 展示 它们 的 用 
法 。 信 和 号 量 的 值 将 由 内 核 从 我 们 的 某 个 程序 维持 到 下 一 个 程序 。 

11.5.1 semcreate 程 序 

图 11-2 给 出 了 我 们 的 第 一 个 程序 ， 它 只 是 创建 一 个 System V 信 和 号 量 
集 。-e 命 令 行 选 项 指定 IPC_EXCL 标 志 ， 该 集合 中 信号 量 的 数目 必须 由 


最 后 一 个 命令 行 参数 指定 。 


svsem/semcreate.c 


1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
4 ( 
5 int c, oflag, semid, nsems; 
6 oflag - SVSEM MODE | IPC CREAT; 
7 while ( (c = Getopt(argc, argv, "e")) !- -1) { 
8 switch (c) ( 
9 case 'e': 
10 oflag |= IPC EXCL; 
LL break; 
12 } 
13 } 
14 if (optind != argc = 2) 
15 err quit("usage: semcreate [ -e ] <pathname> <nsems>") ; 
16 nsems = atoi(argv[optind + 1]); 
17 semid = Semget (Ftok(argv[optind], 0), nsems, oflag) ; 
18 exit (0); 
19 } 
svsem/semcreate.c 
图 11-2 semcreate 程 序 
11.5.2 semrmid 程 序 


图 11-3 给 出 的 下 一 个 程序 会 从 系统 中 删除 一 个 信号 量 集 。 删 除 该 集 
合 通 过 调用 semctl 函 数 执行 PC_RMID 命 令 完成 。 


svsem/semrmid.c 
1 #include "unpipc.h" 
2 int 
3 main(int argc, char **argv) 
£1 
5 int semid; 
6 if (argc != 2) 
了 err quit("usage: semrmid <pathname>") ; 
8 semid = Semget (Ftok(argv[1], 0), 0, 0); 
9 Semctl(semid, 0, IPC RMID); 
10 exit (0); 
35r 3 
svsem/semrmid.c 


图 11-3 semrmid EX Zt 


11.5.3 semsetvalues 程 序 
图 11-4 给 出 的 semsetvalues 程 序 设置 某 个 信号 量 集中 的 所 有 值 。 


svsem/semsetvalues.c 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

& 3 

5 int semid, nsems, i; 

6 struct semid ds seminfo; 

7 unsigned short *ptr; 

8 union semun arg; 

9 IE (arga = 2) 

10 err_quit ("usage: semsetvalues <pathname> [ values ... ]"); 
11 /* first get the number of semaphores in the set */ 

12 semid - Semget(Ftok(argv[1], 0), 0, 0); 

13 arg.buf - &seminfo; 

14 Semctl(semid, 0, IPC STAT, arg); 

l5 nsems = arg.buf-»sem nsems; 

16 /* now get the values from the command line */ 

T if (argc != nsems + 2) 

18 err quit("*d semaphores in set, $d values specified", nsems, argc-2); 
19 /* allocate memory to hold all the values in the set, and store */ 
20 ptr = Calloc(nsems, sizeof (unsigned short)); 

21 arg.array - ptr; 

22 for (i = 0; i < nsems; i++) 

23 ptr[i] = atoi(argv[i + 2]); 

24 Semctl(semid, 0, SETALL, arg); 

25 exit (0); 

26 } 


svsem/semsetvalues.c 


图 11-4 semsetvalues EAU 


取得 集合 中 信和 号 量 的 数目 

117-15 使 用 semget 获 取 所 指定 信号 量 集 的 信号 量 ID 之 后 ， 发 出 一 
^" semctl 的 IPC_STAT 命 令 取得 该 信号 量 的 semid ds 结构 。 其 中 
sem_nsems 成 员 残 是 该 集合 中 信和 号 量 的 数目 。 

设置 所 有 的 值 

19~24 分 配 一 个 unsigned short 整 数 数组 的 内 存 空间 ， 每 个 集合 成 
员 对 应 一 个 数组 元 素 ， 然 后 把 它们 的 值 从 命令 行 复制 到 数组 中 。 接 着 
由 一 个 semctl 的 SETALEL 命 令 设 置 该 信号 量 集 内 所 有 成 员 信和 号 量 的 值 。 

11.5.4 semgetvalues 程 序 

图 11-5 给 出 的 semgetvalues 程 序 取得 并 输出 某 个 信号 量 集 中 的 所 有 
值 。 


svsem/semgetvalues.c 


1 #include "unpipc.h" 

2 dnt 

3 main(int argc, char **argv) 

4 

5 int semid, nsems, i; 

6 struct semid ds seminfo; 

7 unsigned short  *ptr; 

8 union semun arg; 

9 if (argc !- 2) 

10 err quit("usage: semgetvalues «pathname»"); 
11 /* first get the number of semaphores in the set */ 
12 semid - Semget(Ftok(argv[1], 0), 0, 0); 

13 arg.buf - &seminfo; 
14 Semctl(semid, 0, IPC STAT, arg); 

15 nsems - arg.buf-»sem nsems; 

16 /* allocate memory to hold all the values in the set */ 
17 ptr = Calloc(nsems, sizeof (unsigned short)); 
18 arg.array = ptr; 

19 /* fetch the values and print */ 
20 Semctl(semid, 0, GETALL, arg); 
21 for (i = 0; i « nsems; i++) 

22 printf ("semval[%d] = $dMn", i, ptr[il); 
23 exit (0); 
24 ) 


svsem/semgetvalues.c 


图 11-5 semgetvalues 程 序 


取得 集合 中 信和 号 量 的 数目 

117-15 使 用 semget 获 取 所 指定 信号 量 集 的 信号 量 ID 之 后 ， 发 出 一 
^" semctl 的 IPC_STAT 命 令 取得 该 信号 量 的 semid ds 结构 。 其 中 
sem_nsemas 成 员 残 是 该 集合 中 信和 号 量 的 数目 。 

取得 所 有 的 值 

16~22 分 配 一 个 unsigned short 整 数 数 组 的 内 存 空 间 ， 每 个 集合 成 
员 对 应 一 个 数组 元 素 ， 然 后 发 出 一 个 semct 的 GETALL 命 令 获 取 该 信号 
量 集 内 所 有 成 员 信和 号 量 的 值 。 接 着 输出 所 有 的 值 。 

11.5.5 semops 程 序 

图 11-6 给 出 的 semops 程 序 对 某 个 信号 量 集 执行 一 数组 的 操作 。 


svsem/semops.c 


1 #include "unpipc.h" 

2 unt 

3 main(int argc, char **argv) 

4 

5 int c, i, flag, semid, nops; 

6 struct sembuf *ptr; 

7 flag: = 0; 

8 while ( (c = Getopt (argc, argv, "nu")) != -1) { 

9 switch (c) { 

10 case 'n': 

11 flag |= IPC NOWAIT; /* for each operation */ 

12 break; 

13 case "uyur 

14 flag |= SEM UNDO; /* for each operation */ 

15 break; 

16 ) 

17 } 

18 if (argc - optind < 2) /* argc - optind = #args remaining */ 
19 err quit("usage: semops [ -n ] [ -u ] «pathname» operation ..."); 
20 semid - Semget (Ftok(argv[optind], 0), 0, 0); 

21 optind++; 

22 nops = argc - optind; 

23 /* allocate memory to hold operations, store, and perform */ 
24 ptr = Calloc(nops, sizeof(struct sembuf)); 

25 for (i = 0; i < nops; i++) { 

26 ptr [i] .sem num = i; 

27 ptr[i] .sem_op = atoi(argv[optind + il); /* <0, 0, or >0 */ 
28 ptr[il.sem flg = flag; 

29 ) 

30 Semop(semid, ptr, nops); 

DL exit (0); 


svsem/semops.c 


图 11-6 semopsf£ 


命令 行 选项 

7-419 -n 选 项 给 每 个 操作 指定 IPC_NOWAIT 标 志 ，-u 选 项 给 每 个 操 
作 指 定 SEM_UNDO 标 志 。 注 意 ，semop 男 数 允 许 我 们 给 sembuf 结 构 的 
每 个 成 员 (也 就 是 针对 信号 量 集 内 每 个 成 员 的 操作 ) 指定 一 组 不 同 的 
标志 ， 但 是 为 了 简单 起 见 ， 我 们 让 这 些 命令 行 选项 给 所 有 成 员 信号 量 
各 目的 指定 操作 统一 指定 相应 标志 。 

给 各 个 操作 分 配 内 存 空间 


20~29 使 用 semget 打 开 所 指定 的 信号 量 集 后 ， 分 配 一 个 sembuf 结 


构 数组 ， 命 令 行 中 指定 的 每 个 操作 对 应 一 个 数组 元 素 。 与 前 两 个 程序 
不 同 ， 本 程序 允许 用 户 指 定 少 于 相应 信号 量 集 内 成 员 数 目的 操作 个 
数 。 


执行 各 个 操作 

30 semop 在 所 指定 信号 量 集 上 执行 刚才 创建 的 操作 数组 。 

11.5.6 例子 

现在 演示 刚刚 给 出 的 5 个 程序 ， 以 查看 System V 信 号 量 的 某 些 特 


solaris 96 touch /tmp/rich 

solaris 96 semcreate -e /tmp/rich 3 

solaris 96 semsetvalues /tmp/rich 1 2 3 

solaris 96 semgetvalues /tmp/rich 

semval[0] = 1 

semval[1] = 

semval[2] = 

我 们 首先 创建 一 个 名 为 /tmp/rich 的 文件 ， n (通过 ftok) 用 于 标 
识 本 例子 所 用 的 信号 量 集 。semcreate 创 建 一 ER N RES FE 
。Ssemsetvalues 把 它们 的 值 分 别 设置 为 1、2 和 3， 这 些 值 随 后 由 


semgetvalues 输 出 。 


我 们 接着 演示 在 一 个 信号 量 集 上 执行 一 组 操作 的 原子 性 。 
solaris % semops -n /tmp/rich -1 -2 -4 

semctl error: Resource temporarily unavailable 

solaris 96 semgetvalues /tmp/rich 

semval[0] = 1 

semval[1] = 2 


semval[2] = 


我 们 指定 了 非 阻塞 标志 Cn) 和 三 个 操作 ， 每 个 操作 分 别 减 少 刚 创 
建 信号 量 集 内 的 某 个 值 。 第 一 个 操作 可 以 执行 (我们 可 以 从 该 集合 值 
为 1 的 第 一 个 成 员 中 减 掉 1) ， 第 二 个 操作 也 可 以 执行 (我们 可 以 从 该 
集合 值 为 2 的 第 二 个 成 员 中 减 掉 2) ， 但 是 第 三 个 操作 却 无 法 执行 (我 
们 不 能 从 该 集合 值 为 3 的 第 三 个 成 员 中 减 掉 4) 。 既然 最 后 一 个 操作 不 
能 执行 ， 而 且 指定 了 非 阻塞 标志 ， 那 么 将 返回 一 个 EAGAIN 错 误 。 (要 
是 未 曾 指 定 非 阻 塞 标 志 ， 我 们 的 程序 就 只 是 阻塞 。) 我 们 接着 验证 该 
集合 中 没有 值 变动 过 。 尽 管 前 两 个 操作 可 以 执行 ， 但 是 由 于 最 后 一 个 
操作 不 能 执行 ， 因 此 这 三 个 操作 都 不 执行 。semop 的 原子 性 意味 着 要 人 么 
所 有 操作 都 执行 ， 要 么 一 个 操作 都 不 执行 。 

下 面 演示 System V 信 号 量 的 SEM_UNDO 属 性 。 


solaris 96 semsetvalues /tmp/rich 1 2 3 设置 成 已 知 值 
solaris % semops -u /tmp/rich -1 -2 -3 给 每 个 操作 指定 


SEM_UNDO 标 志 solaris % semgetvalues /tmp/rich 

semval[0] = 1 当 semops 
终止 时 所 有 变动 都 被 取消 

semval[1] = 2 


semval[2] = 3 


solaris 96 semops /tmp/rich -1 -2 -3 不 指定 SEM_UNDO 
标志 solaris 96 semgetvalues /tmp/rich 
semval[0] = 0 变动 未 被 


取消 semval[1] = 0 

semval[2] = 0 

我 们 首先 使 用 semsetvalues 把 三 个 信号 量 值 重新 置 为 1、2 和 3， 然 后 
使 用 semops 指 定 -1、-2 和 -3 三 个 操作 。 这 导致 所 有 三 个 值 都 变 为 0， 但 
是 既然 我 们 给 semops 程 序 指定 了 -u 选 项 ， 那 么 所 有 三 个 操作 都 被 指定 了 
SEM_UNDO 标 志 。 这 人 么 一 来 ， 这 三 个 成 员 信号 量 的 semadj 值 就 分 别 被 


置 为 1、2 和 3。 后 来 当 semops 程 序 终 止 时 ， 这 三 个 semadj 值 就 分 别 加 到 
三 个 成 员 信号 量 的 当前 值 (7930) 上， 导致 它们 的 最 终 值 分别 变 为 
1、2 和 3， 这 一 点 我 们 用 semgetvalues 程 序 验 证 了 。 我 们 接着 再 次 执行 
semops 程 序 ， 不 过 这 次 不 指定 -u 选 项 ， 其 结果 是 当 semops 程 序 终止 时 ， 
所 有 三 个 成 员 信号 量 的 值 都 保持 为 0， 而 不 回复 到 开始 执行 semops 程 序 
时 的 值 。 


11.6 文件 上 锁 


我 们 可 以 提供 图 10-19 中 my_lock 和 my_unlock 函 数 的 男 一 个 版 本 ， 
它们 使 用 System V 信 号 量 实现 。 图 11-7 给 出 了 这 个 版 本 © 


1 #include "unpipc.h" 


2 #define LOCK PATH "/tmp/svsemlock" 
3 #define MAX TRIES 10 


4 int semid, initflag; 
5 struct sembuf postop, waitop; 


6 void 

7 my lock(int fd) 

8 { 

9 int oflag, i; 

10 union semun arg; 

11 struct semid_ds seminfo; 

12 if (initflag == 0) 

13 oflag = IPC CREAT | IPC EXCL | SVSEM MODE; 

14 if ( (semid = semget (Ftok(LOCK PATH, 0), 1, oflag)) >= 0) { 
15 /* success, we're the first so initialize */ 
16 arg.val - 1; 

17 Semctl(semid, 0, SETVAL, arg); 

18 ) else if (errno -- EEXIST) ( 

19 /* someone else has created; make sure it's initialized */ 
20 semid - Semget(Ftok(LOCK PATH, 0), 1, SVSEM MODE); 
23: arg.buf - &seminfo; 

22 for (i = 0; i < MAX TRIES; i++) { 

23 Semctl(semid, 0, IPC STAT, arg); 

24 if (arg.buf-»sem otime !- 0) 

25 goto init; 

26 sleep(1); 

27 

28 err quit("semget OK, but semaphore not initialized"); 
29 ) eise 

30 err sys("semget error"); 

31 init: 

32 initflag - 1; 

33 postop.sem num = 0; /* and init the two semop() structures */ 
34 postop.sem op - 1; 

35 postop.sem flg - SEM UNDO; 

36 waitop.sem num - 0; 

37 waitop.sem op - -1; 

38 waitop.sem flg - SEM UNDO; 

39 ) 

40 Semop(semid, &waitop, 1); /* down by 1 */ 

41 ) 

42 void 

43 my unlock(int fd) 

44 { 

45 Semop(semid, &postop, 1); /* up by 1 */ 

46 ) 


图 11-7 使 用 System V 信 和 号 量 实现 的 文件 上 锁 


首先 尝试 独占 创建 


lock/locksvsem.c 


lock/locksvsem.c 


137-17 我 们 必须 保证 只 有 单个 进程 初始 化 文件 上 锁 信 号 量 ， 因 此 


给 semget 指 定 了 IPC_CREATIIPC_EXCL 标 志 。 如 果 创 建成 功 ， 当 前 进 


程 束 调用 semctl 将 该 信号 量 的 值 初始 化 为 1。 如果 有 多 个 进程 几乎 同时 
调用 我 们 的 my_lock 夯 数 ， 那 么 只 有 一 个 进程 会 创建 出 文件 上 锁 信 和 号 量 
(假设 它 尚 未 存在 ) ， 接 着 初始 化 该 信号 量 的 也 是 这 个 进程 。 

信号 量 已 存在 ， 那 就 打开 它 

18~20 对 于 其 他 进程 来 说 ， 第 一 个 semget 调 用 将 返回 一 个 EEXIST 
若 误 ， 它 们 于 是 再 次 调用 semget ， 不 过 这 次 不 指定 
IPC_CREATIIPC_EXCL 标 志 。 

等 待 信号 量 被 初始 化 

21~28 我 们 遇 到 了 11.2 节 中 讲解 System V 信 和 号 量 的 初始 化 时 讨论 过 
的 同一 竞争 状态 。 为 避免 该 竞争 状态 ， 发 现 文件 上 锁 信和 号 量 已 存在 的 
任何 进程 都 必须 以 IPC_STAT 命 令 调 用 semctl ， 以 查看 该 信号 量 的 
sem_otime 值 。 如 果 该 值 不 为 0， 我 们 就 知道 创建 该 信号 量 的 进程 已 对 
它 初 始 化 ， 并 已 调用 semop (semop 调 用 在 本 函数 末尾 ) 。 如 果 该 信号 
量 的 sem_otime 值 仍 为 0 (这 种 情况 应 该 非常 罕见 ， 我 们 就 sleep 1 秒 
和 尝试。 我 们 限制 了 尝试 次 数 ， 避 免 发 生 永 人 睡眠 。 

初始 化 sembuf 结 构 

33~38 我 们 早先 提 及 ，sembuf 结 构 中 各 成 员 的 排列 顺序 没有 保 
证 ， 因 此 不 能 静态 地 初始 化 它们 。 当 一 个 进程 首次 调用 my_lock 时 ， 我 
们 分 配 两 个 这 样 的 结构 ， 并 在 运行 时 填写 它们 。 我 们 指定 了 
SEM_UNDO 标 志 ， 这 样 的 话 如 果 某 个 进程 在 持 有 锁 期 间 终止 了 ， 内 核 
会 释放 该 锁 (见习 题 10.3) 。 

在 首次 使 用 时 创建 一 个 信号 量 很 容易 (每 个 进程 尝试 创建 它 ， 但 
是 如 果 它 已 经 存在 ， 那 就 忽略 所 产生 的 错误 ) ， 然 而 在 所 有 进程 都 完 
成 后 将 它 删除 要 困难 得 多 。 在 使 用 序列 号 文件 分 配 作 业 号 的 打印 机 守 
护 进 程 例子 中 ， 信 和 号 量 将 一 直 存 在 下 去 。 但 是 其 他 应 用 程序 可 能 希望 
一 旦 需要 上 锁 的 文件 被 删除 ， 其 信号 量 也 被 删除 。 对 于 这 种 情况 ， 使 
用 记录 锁 也 许 比 使 用 信和 号 量 更 好 。 


11.7 信号 量 


跟 System V 消 姑 队 列 一 样 ，System V 信 号 量 也 有 特定 的 系统 限制 ， 
其 中 大 部 分 源 自 最 初 的 System V 实 现 (3.8 节 ) 。 图 11-8 展 示 了 这 些 限 
制 。 第 一 栏 是 含有 相应 限制 值 的 内 核 变 量 的 传统 System V 名 字 。 


系统 范围 最 大 信号 量 集 数 
每 个 信号 量 集 最 大 信号 量 交 
系统 范围 最 大 信号 量 数 


系统 范围 最 大 复 旧 结 构 数 ' | 30 | 
每 个 复 旧 结 构 最 大 复 旧 项 数 
任何 信号 量 的 最 大 什 
最 大 退出 时 调整 Cadjust-on-exit) fH 


图 11-8 System V 信 号 量 的 典型 限制 值 
QD) 每 个 复 旧 (undo) 结构 对 应 一 个 进程 。 一 一 译 者 注 

Digital Unix 显 然 不 存在 semmnu 限 制 。 

例子 

图 11-9 中 的 程序 确定 图 11-8 中 给 出 的 各 个 限制 值 。 


svsem/limits.c 


1 #include "unpipc.h" 

2 /* following are upper limits of values to try */ 

3 #define MAX NIDS 4096 /* max # semaphore IDs */ 
4 #define MAX VALUE 1024*1024 /* max semaphore value */ 
5 #define MAX MEMBERS 4096 /* max # semaphores per semaphore set */ 
6 #define MAX NOPS 4096 /* max # operations per semop() */ 
7 #define MAX NPROC Sysconf( SC CHILD MAX) 

8 int 

9 main(int argc, char **argv) 

10 ( 

11. int i, j, semid, sid[MAX NIDS], pipefd[2]; 

12 int semmni, semvmx, semmsl, semmns, semopn, semaem, semume, semmnu; 
13 pid t  *chilg; 

14 union semun arg; 

15 struct sembuf ops [MAX NOPS]; 

16 /* see how many sets with one member we can create */ 

17 for (i = 0; i <= MAX NIDS; i++) { 

18 sid[i] = semget(IPC PRIVATE, 1, SVSEM MODE | IPC CREAT); 
19 if (sid[i] == -1) { 

20 semmni - i; 

21 printf ("%d identifiers open at once\n", semmi); 

22 break; 

23 } 

24 } 

25 /* before deleting, find maximum value using sid[0] */ 
26 for (j = 7; j « MAX VALUE; j += 8) { 

27 arg.val - j; 

28 if (semctl(sid[0], 0, SETVAL, arg) == -1) { 

29 semvmx = j - 8; 

30 printf ("max semaphore value = %d\n", semvmx) ; 

31 break; 

32 } 

33 } 

34 for (j = Os 3 € i; Jre) 

35 Semctl(sid[j], 0, IPC RMID); 

36 /* determine max # semaphores per semaphore set */ 

37 for (i = 1; i <= MAX MEMBERS; i++) { 

38 semid - semget(IPC PRIVATE, i, SVSEM MODE | IPC CREAT); 
39 if (semid -- -1) ( 

40 semmsl = i - 1; 

41 printf ("max of %d members per set\n", semmsl); 

42 break; 

43 ) 

44 Semctl(semid, 0, IPC RMID); 

45 ) 

46 /* find max of total # of semaphores we can create */ 

47 semmns = 0; 


图 11-9 确定 System V 信 和 号 量 上 的 系统 限制 值 


for (i = 0; i < semmni; i++) { 
sid[i] = semget(IPC PRIVATE, semmsl, SVSEM MODE | IPC CREAT); 
if (sid[i] == -1) [ 
/* 
* Up to this point each set has been created with semmsl 


* members. But this just failed, so try recreating this 
* final set with one fewer member per set, until it works. 


*/ 
for (j = semmsl - 1; j > 0; j--) { 
sid[i] = semget(IPC PRIVATE, j, SVSEM MODE | IPC CREAT); 
if (sid[i] != -1) { 
semmns += j; 
printf ("max of td semaphores\n", semmns) ; 
Semctl(sid[i], 0, IPC RMID); 
goto done; 
) 
} 
err quit ("j reached 0, semmns = %d", semmns) ; 
} 
semmns += semmsl; 
} 
printf ("max of %d semaphores\n", semmns) ; 
done: 


for (j = 0; j < i; j++) 
Semctl(sid[j], 0, IPC RMID); 


/* see how many operations per semop() */ 
semid - Semget(IPC PRIVATE, semmsl, SVSEM MODE | IPC CREAT); 
for (i = 1; i <= MAX NOPS; i++) { 
ops[i - 1].sem_num = i - 1; 
ops[i - 1].sem_op = 1; 
ops[i - 1].sem flg = 0; 
if (semop(semid, ops, i) == -1) { 
if (errno != E2BIG) 
err sys("expected E2BIG from semop") ; 
semopn - i-1; 
printf ("max of £d operations per semop()\n", semopn); 
break; 
) 
) 
Semctl(semid, 0, IPC RMID); 
/* determine the max value of semadj */ 
/* create one set with one semaphore */ 
semid - Semget(IPC PRIVATE, 1, SVSEM MODE | IPC CREAT); 
arg.val - semvmx; 
Semctl(semid, 0, SETVAL, arg); /* set value to max */ 
for (i = semvmx - 1; i > 0; i--) { 
ops[0].sem num - 0; 
ops[0].sem op - -i; 
ops[0].sem flg - SEM UNDO; 
if (semop(semid, ops, 1) != -1) { 
semaem = i; 
printf ("max value of adjust-on-exit = %d\n", semaem); 
break; 


图 11-9 ( 续 ) 


102 } 

103 Semctl(semid, 0, IPC RMID); 

104 /* determine max # undo structures */ 

105 /* create one set with one semaphore; init to 0 */ 


106 semid = Semget(IPC PRIVATE, 1, SVSEM MODE | IPC CREAT); 

107 arg.val = 0; 

108 Semctl(semid, 0, SETVAL, arg); /* set semaphore value to 0 */ 
109 Pipe (pipefd); 

110 child = Malloc(MAX NPROC * sizeof (pid t)); 

111 for (i = 0; i < MAX NPROC; i++) { 

112 if ( (child[i] = fork()) == -1) ( 


113 semmnu = i - 1; 

114 printf ("fork failed, semmnu at least %d\n", semmnu) ; 
115 break; 

116 } eise if (child[i] == 0) { 

117 ops [0] .sem num = 0; /* child does the semop() */ 
118 ops [0] .sem op = 1; 

119 ops[0].sem flg - SEM UNDO; 

120 j = semop(semid, ops, 1); /* 0 if OK, -1 if error */ 
121 Write(pipefd[1], &j, sizeof(j)); 

122 sleep (30) ; /* wait to be killed by parent */ 
123 exit (0); /* just in case */ 

124 } 

125 /* parent reads result of semop() */ 

126 Read(pipefd[0], &j, sizeof(j)); 

127 XE (J == F] { 

128 semmnu = i; 

129 printf ("max # undo structures = %d\n", semmnu) ; 

130 break; 

131 } 

132 } 


133 Semctl(semid, 0, IPC_RMID) ; 
134 for (j = 0; j <= i && child[j] > 0; j++) 


135 Kill (child[j], SIGINT); 

136 /* determine max # adjust entries per process */ 

137 /* create one set with max # of semaphores */ 

138 semid = Semget(IPC PRIVATE, semmsl, SVSEM MODE | IPC CREAT); 

139 for (i = 0; i < semmsl; i++) { 

140 arg.val = 0; 

141 Semctl(semid, i, SETVAL, arg); /* set semaphore value to 0 */ 
142 ops[i].sem num - i; 

143 ops [il.sem op = 1; /* add 1 to the value */ 

144 ops[i].sem flg - SEM UNDO; 

145 if (semop(semid, ops, i + 1) == -1) { 

146 semume - i; 

147 printf("max # undo entries per process = %d\n", semume); 
148 break; 

149 ) 

150 ) 


151 Semctl(semid, 0, IPC RMID); 


152 exit (0); 
153 ) 


svsem/limits.c 


图 11-9 ( 续 ) 


11.8 小 结 


从 Posix 信 号 量 到 System V 信 和 号 量 发 生 了 如 下 变动 。 

(1)System V 信 号 量 由 一 组 值 构 成 。 当 指定 应 用 到 某 个 信号 量 集 的 
一 组 信号 量 操作 上 时， 要么 所 有 操作 都 执行 ， 要 么 一 个 操作 都 不 执行 。 

(2) 可 应 用 到 一 个 信号 量 集 的 每 个 成 员 的 操作 有 三 种 : 测试 其 值 是 
否 为 0、 往 其 值 加 一 个 整数 以 及 从 其 值 中 减 掉 一 个 整数 (假设 结果 值 仍 
然 非 负 ) 。Posix 信 号 量 所 允许 的 操作 只 是 将 其 值 加 1 或 减 1 (假设 结 
值 仍然 非 负 ) 。 

(3) 创 建 一 个 System V 信 号 量 集 需 要 技巧 ， 因 为 创建 该 集合 并 随后 
初始 化 其 各 个 值 需要 两 个 操作 ， 从 而 可 能 导致 竞争 状态 。 

(4)System V 信 号 量 提 供 “ 复 旧 ” 特 性 ， 该 特性 保证 在 进程 终止 时 谤 
转 某 个 信号 量 操作 。 


习题 


11.1 图 6-8 是 对 图 6-6 的 修改 ， 它 接受 用 于 指定 消息 队列 的 标识 符 而 
不 是 路 径 名 。 从 中 看 出 访问 一 个 System V 消 息 队 列 只 需 知道 其 标识 符 
(前 提 是 有 足够 的 权限 ) 。 对 图 11-6 进 行 类 似 的 修改 ， 以 展示 同样 的 特 

性 也 适用 于 System V 信 和 号 量 。 
11.2 如 条 LOCK_PATH 文 件 不 存在 ， 那 么 图 11-7 中 的 函数 会 发 生 什 


AT 


[1]. 一 个 进程 可 以 对 某 个 文件 的 特定 字 节 范围 多 次 发 出 F_SETLK 或 

F_SETLKW 命 令 ， 每 次 成 功 与 否 取决 于 其 他 进程 当时 是 否 锁 住 该 字 贡 
范围 以 及 锁 的 类 型 ， 而 与 本 进程 先前 是 否 锁 住 该 字 节 范围 无 关 。 也 就 
是 说 ， 后 执行 的 F_SETLK 或 F_SETLKW 命 令 履 盖 先 执行 的 针对 同一 字 
节 范 围 的 同样 两 个 命令 。 男 外 ， 文 件 能 否 读 写 与 相应 的 记录 是 否 被 其 


他 进程 锁 住 无 关 《前 提 是 劝告 性 上 锁 ) ， 前 者 由 文件 访问 权限 完全 决 
定 。 这 就 古 说， 一 个 进程 有 可 能 访问 已 被 娘 一 个 进程 独占 地 锁 住 的 文 
B 的 记录 ， p er 的 进程 应 目 觉 地 不 去 执行 违反 上 锁 要 求 的 
访问 。 一 一 详 着 ; 


[2]. 调用 进程 已 持 有 的 针对 同一 字 节 范围 的 锁 不 会 妨碍 它 获 取 新 锁 ， 
为 同一 进程 内 ， 后 执行 的 获取 锁 命令 履 盖 先 执行 的 命令 。 举 例 来 说 ， 

如 果 一 个 进程 针对 同一 字 节 范围 先后 执行 两 个 命令 : F_SETLK (I type 
成 员 为 F_WRLCK) 和 F_GETLK (〈Ltype 成 员 为 F_ RDLCK) ， 这 两 个 

命令 之 间 无 其 他 进程 干扰 ， 而 且 它 们 都 执行 成 功 ， 那 么 由 F_GETLK 返 
回 的 ]_type 成 员 是 F_UNLCK 而 不 是 F_WRLCK。 一 一 译 者 注 


[3]. 确实 如 此 ， 甚 至 于 所 关闭 的 描述 符 先前 是 在 其 文件 已 由 本 进程 GB 
过 该 文件 的 另 一 个 描述 符 ) 上 锁 后 才 打开 也 不 例外 。 看 来 删除 锁 时 关 
链 的 是 进程 ID， 而 不 是 引用 同一 文件 的 描述 符 数 目 及 打开 目的 (只 
读 、 只 写 、 读 写 ) 。 既 然 锁 跟 进 程 ID 紧 密 关联 ， 它 不 能 通过 fork 由 子 进 
程 继承 也 就 顺理成章 ， 因 为 父子 进程 有 不 同 的 进程 ID。 一 一 译 者 注 


[4]. 为 避免 在 子 进程 的 输出 中 出 现 shell 提 示 符 ， 可 以 在 第 34 行 和 第 35 行 
之 间 插 入 一 行 “wait(NULL); wait(NULIL);” 以 等 待 两 个 子 进程 终止 。 图 9- 
9、 图 12-10 和 图 12-12 中 的 程序 也 有 类 似 情况 。 


[5]: 试想 ， 消 费 者 消费 挥 生产 者 产生 的 所 有 数据 时 ，nempty 和 nstore 的 
值 肯定 恢复 成 生产 -消费 过 程 尚 未 开始 时 的 值 (分 别 为 NBUFF 和 0) 。 

也 融 是 说 生产 -消费 过 程 的 结束 状态 与 开始 状态 是 一 致 的 。 此 后 所 有 生 
产 者 线程 都 执行 第 47 行 的 Sem_wait， 其 中 有 nempty 个 线程 返回 ， 其 余 
线程 则 阻塞 。 未 阻 禾 的 线程 要 是 不 执行 第 50 行 的 Sem_post， 已 阻 暑 的 
线程 将 永远 阻塞 下 去 。 水 远 阻 塞 的 线程 数 于 是 为 生产 -消费 过 程 结束 时 
Hnempty=nproducers-NBUFF ° 译 者 注 


[6]. 生产 -消费 过 程 刚 结束 时 ，nempty 和 nstored 恢 复 为 生产 -消费 过 程 尚 
未 开始 时 的 值 (分 别 为 NBUFF 和 0) 。 生 产 者 函数 produce 中 新 增 的 
Sem_post 行 使 得 只 要 有 一 个 生产 者 线程 终止 ，nstored 的 值 就 大 于 0 ( 当 
所 有 生产 者 线程 都 终止 时 ，nstored 的 值 将 变 为 nproducers) 。 由 于 消费 
者 函数 consume 中 第 77 行 的 Sem_wait 和 第 80 行 的 Sem_post 匹 配 成 对 ， 
此 只 要 nstored 大 于 0， 不 论 有 多 少 个 消费 者 线程 ， 都 能 一 个 也 不 阻塞 地 
全 部 终止 。 所 有 消费 者 线程 都 终止 时 ， 所 有 生产 者 线程 不 一 定 都 已 终 
ik, (HB>A—-PEAIE 9 译 者 注 


[7]. 在 调用 线程 执行 本 函数 期 间 ， 系 统 可 能 切换 针对 同一 信号 量 调 用 
sem_open 函 数 的 另 一 个 线程 来 运行 。 要 是 把 本 函数 改 为 移 删 除 关 联 的 
System V 信 号 量 ， 再 删除 辅助 文件 ， 那 么 一 旦 线程 切换 发 生 在 这 两 个 
删除 操作 之 间 ， 执 行 sm_open 的 线程 将 发 现 所 需 的 Posix 信 号 量 已 存在 

(因为 其 辅助 文件 尚未 删除 ) ， 但 是 与 之 关联 的 System V 信 和 号 量 却 打 
不 开 《因为 已 被 删除 了 ) ， 于 是 出 错 。 译 者 注 


[8]. 调用 进程 终止 时 ，semadj 加 到 相应 信号 量 的 semval 之 上 。 要 是 调用 
进程 对 某 个 信号 量 的 全 部 操作 都 指定 SEM_UNDO 标 志 ， 那 么 该 进程 终 
止 后 ， 该 信号 量 的 值 束 会 变 得 像 根 本 没有 运行 过 该 进程 一 样 ， 这 就 是 
4H (undo) 的 本 意 。 一 一 译 者 注 


12 Xjprz 


12.1 概述 
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享 它 的 进程 的 地 址 空间 ， 这 些 进程 间 数 据 的 传递 就 不 再 涉及 内 核 。 然 
而 往 该 共享 内 存 区 存放 信息 或 从 中 取 走 信息 的 进程 间 通 常 需要 某 种 形 
式 的 同步 。 我 们 在 第 三 部 分 中 已 经 讨论 了 各 种 形式 的 同步 : 互 斥 锁 、 
条 件 变量 、 读 写 锁 、 记 录 锁 、 信 号 量 。 

这 里 说 的 “不 再 涉及 内 核 ” 的 作 义 是 : 进程 不 再 通过 执行 任何 进入 内 
核 的 系统 调用 来 彼此 传递 数据 。 显然， 内 核 必须 建立 允许 各 个 进程 共 
译 该 内 存 区 的 内 存 映 射 关 系 ， 然 后 一 直 管 理 该 内 存 区 (处 理 页 面 故 障 
等 ) 。 

考虑 用 来 传递 各 种 类 型 消 轧 的 一 个 示例 客户 -服务 融 文 件 复 制程 序 
中 涉及 的 通 币 步 又 。 

服务 器 从 输入 文件 读 。 该 文件 的 数据 由 内 核 读 入 目 己 的 内 存 空 
间 ， 然 后 从 内 核 复 制 到 服务 紫 进 程 。 

服务 右 往 一 个 管道 、FIFO 或 消 乱 队列 以 一 条 消 居 的 形式 写 入 这 些 
数据 。 这 些 IPC 形 式 通 单 需要 把 这 些 数据 从 进程 复制 到 内 核 。 


x E E FH BR XE 19] 388 AS” EA Posix BABA) nT f Fl N R/O 
KAK mmap žo 实现 ， 如 5.8 节 和 习题 12.2 的 解答 DT 
在 图 12- "UE 我 们 假设 Posix 消 恩 队 列 是 在 内 核 中 实现 的 ， 这 是 男 外 一 
种 可 能 实现 。 然 而 管道 、FIFO 和 System V 消 息 队 列 的 write 或 msgsnd 都 

| 它们 的 read 或 msgrcv 都 涉及 从 内 核 到 进 
程 的 数据 复制 。 

客户 从 该 IPC 通 道 读 出 这 些 数据 ， 这 通常 需要 把 这 些 数据 从 内 核 复 
制 到 进程 。 

最 后 ， 将 这 些 数据 从 由 write 函数 的 第 二 个 参数 指定 的 客户 缓冲 区 
复制 3 输出 文件 。 

这 里 通常 需要 总 共 四 次 数据 复制 。 而 且 这 四 次 复制 是 在 内 核 和 某 

个 进程 间 进 行 的 ， 往 往 开销 很 大 ( 比 纯粹 在 内 核 中 或 单个 进程 内 复制 
数据 的 开销 大 ) 。 图 12-1 展 示 了 客户 与 服务 器 之 间 通 过 内 核 桥 接 的 数据 
转移 。 


read(). mq receive()  write(). mq send() 
Bi msgrcv () 了 


或 msgsnd () 进程 


内 核 


IPC (管道 、 FIFO 
或 消息 队列 ) 


图 12-1 从 服务 器 到 客户 的 文件 数据 流 
这 些 IPC 形 式 (管道 、FIFO 和 消息 队列 ) 的 问题 在 于 ， 两 个 进程 要 
交换 信息 时 ， 这 些 信 息 必须 经 由 内 核 传递 。 
通过 让 两 个 或 多 个 进程 共享 一 个 内 存 区 ， 共 享 内 存 区 这 种 IPC 形 式 
提供 了 绕 过 上 述 问题 的 办 法 。 当 然 ， 这 些 进程 必须 协调 或 同步 对 该 共 
享 内 存 区 的 使 用 。 (共享 一 个 公共 的 内 存 区 跟 共 享 一 个 硬盘 文件 类 


似 ， 例 如 本 书 所 有 文件 上 锁 例 子 中 都 使 用 的 那个 序列 号 文件 。) 第 三 
部 分 讲述 的 任何 技巧 都 可 用 于 这 样 的 同步 目的 。 

前 面 的 客户 -服务 占 例 子 现在 涉及 的 步 又 如 下 。 

服务 器 使 用 (譬如 说 ) 一 个 信号 量 取得 访问 某 个 共享 内 存 区 对 象 
的 权力 。 

服务 器 将 数据 从 输入 文件 读 入 到 该 共享 内 存 区 对 象 。read 函 数 的 第 
二 个 参数 所 指定 的 数据 缓冲 区 地 址 指向 这 个 共享 内 存 区 对 象 。 

服务 需 读 入 完毕 时 ， 使 用 一 个 信号 量 通知 客户 。 

客户 将 这 些 数据 从 该 共享 内 存 区 对 象 写 出 到 输出 文件 中 。 

图 12-2 展 示 了 这 个 情形 。 


共享 内 存 区 


eee Aa eee an HORUM. Cem i 


内 核 


图 12-2 使 用 共享 内 存 区 将 文件 数据 从 服务 器 复制 到 客户 


本 图 中 数据 只 复制 两 次 : 一 次 从 输入 文件 到 共享 内 存 区 ， 男 一 次 
从 共享 内 存 区 到 输出 文件 。 我 们 画 了 一 个 包围 客户 和 该 共享 内 存 区 对 
象 的 虚 框 ， 又 画 了 男 一 个 包围 服务 器 和 该 共享 内 存 区 对 象 的 虚 杠 ， 目 
的 是 强调 该 共享 内 存 区 对 象 同时 出 现在 客户 和 服务 器 的 地 址 空间 中 。 

使 用 共享 内 存 区 所 涉及 的 概念 对 于 Posix 接 口 和 System V 接 口 都 类 
似 。 我 们 将 在 第 13 章 中 讲述 前 者 ， 在 第 14 章 中 讲述 后 者 。 

本 章 中 我 们 返回 到 第 9 章 中 开始 介绍 的 序列 号 加 1 的 例子 。 不 过 我 
们 现在 把 序列 号 存放 在 内 存 中 而 不 是 某 个 文件 里 。 


我 们 首先 再 次 强调 ， 默 认 情 况 下 通过 fork 派 生 的 子 进程 并 不 与 其 父 
进程 共享 内 存 区 。 图 12-3 中 的 程序 让 父子 进程 都 给 一 个 名 为 count 的 全 
局 整数 加 1 。 

创建 并 初始 化 信号 量 

12~14 创建 并 初始 化 一 个 信号 量 ， 它 保护 我 们 认为 其 为 一 个 共享 
变量 的 对 象 (全 局 变量 count) 。 由 于 这 样 的 假设 不 正确 ， 该 信号 量 实 
际 上 并 非 必要 。 注 意 ， 我 们 通过 调用 sem_unlink 从 系统 中 删除 了 该 信号 
量 的 名 字 ， 但 是 尽管 这 么 一 来 删除 了 它 的 路 径 名 ， 对 于 已 经 打开 的 信 
号 量 却 没有 影响 。 这 样 做 后 即使 本 程序 中 止 了 ， 该 路 径 名 也 已 从 系统 
中 删除 。 


shm/incrl.c 
1 #include "unpipc.h" 
2 #define SEM NAME "mysem" 
d int count = 0; 
4 int 
5 main(int argc, char **argv) 
6 { 
7 int i, nloop; 
8 sem_t *mutex; 
9 if (argc != 2) 
10 err quit("usage: incrl <#loops>") ; 
11 nloop = atoi (argv[1]); 
12 /* create, initialize, and unlink semaphore */ 
13 mutex - Sem open(Px ipc name(SEM NAME), O CREAT | O EXCL, FILE MODE, 1); 
14 Sem unlink(Px ipc name(SEM NAME)); 
15 setbuf (stdout, NULL); /* stdout is unbuffered */ 
16 if (Fork() == 0) { /* child */ 
i7 for (i = 0; i < nloop; i++) { 
18 Sem_wait (mutex) ; 
19 printf ("child: $dWMn", count++) ; 
20 Sem_post (mutex) ; 
21 } 
22 exit (0) ; 
23 } 
24 /* parent */ 
25 for (i = 0; i < nloop; i++) { 
26 Sem_wait (mutex) ; 
27 printf ("parent: %d\n", count++) ; 
28 Sem_post (mutex) ; 
29 } 
30 exit (0) ; 
31 } 


shm/incr l.c 


图 12-3 父子 进程 都 给 同一 个 全 局 变量 加 1 


把 标准 输出 设置 为 非 缓 冲 ， 然 后 fork 
15 把 标准 输出 设置 为 非 缓冲 模式 ， 因 为 父子 进程 都 要 往 它 写 出 结 


果 。 这 样 可 以 防止 这 两 个 进程 的 输出 不 恰当 地 交 插 。 [1] 


16 一 29 父 于 进程 都 执行 一 个 人 循环， 该 人 循环 对 计数 右 执 行 指定 次 数 


运行 该 程序 ， 


如 下 结 


child: 0 
child: 1 
child: 678 


child: 679 


parent: 0 


数 器 从 0 开始 计数 


parent: 1 


parent: 1220 
parent: 1221 
child: 680 
child: 681 

.. .Child: 2078 
child: 2079 
parent: 1222 
parent: 1223 


的 加 1， 并 小 心地 保证 只 在 持 有 保护 它 的 信号 量 时 才 给 该 变量 加 1 。 


只 查看 系统 在 父子 进程 间 切 换 时 的 输出 ， 我 们 得 到 


子 进 程 首先 运行 ,计数器 从 0 开始 


子 进 程 被 阻止 ， 父 进程 运行 ， 计 


父 进程 被 阻止 ， 子 进程 接着 运行 


子 进程 被 阻止 ， 父 进程 接着 运行 


如 此 等 等 


可 以 看 出 这 两 个 进程 都 有 各 自 的 全 局 变量 count 的 副本 。 每 个 进程 
都 从 该 变量 为 0 的 初始 值 开 始 ， 而 且 每 次 加 1 的 对 象 是 各 自 的 变量 的 副 
本 。 图 12-4 展 示 了 调用 fork 之 前 的 父 进程 。 


父 进 程 


int count; 


父 进 程 在 这 里 执行 一 和 | if (Fork() == ) { 
/* child */ 


} 


/* parent */ 


图 12-4 调用 fork 之 前 的 父 过 程 
调用 fork 后 ， 子 进程 从 其 父 进 程 数 据 空间 的 映射 副本 开始 运行 。 图 
12-5 展 示 了 fork 返 回 后 的 两 个 进程 。 


父 进程 子 进程 
int count; int count; 
if (Fork() -- 0) ( if (Fork() -- 0) ( 
/* child */ /* child */ 
- 子 进程 在 e Ši 
} 这 里 执行 } 
/* parent */ /* parent */ 
父 进程 在 edi. M. 
这 里 执行 


图 12-5 fork 返 回 之 后 的 父子 进程 


我 们 看 到 父子 进程 都 有 各 目的 变量 count 的 副本 。 


12.2 mmap ` munmap 和 msync 图 数 


mmap 函 数 把 一 个 文件 或 一 个 Posix 共 享 内 存 区 对 象 映射 到 调用 进程 
的 地 址 空间 。 使 用 该 贸 数 有 三 个 目的 : 

(1) 使 用 普通 文件 以 提供 内 存 映射 TO (12.35). ; 

(2) 使 用 特殊 文件 以 提供 匿名 内 存 映射 (12.4 5012.55). ; 

(3) 使 用 shm_open 以 提供 无 亲缘 关系 进程 间 的 Posix 共 享 内 存 区 (第 
13 章 ) 。 

#include <sys/mman.h> 

void *mmap(void *addr,size_t len,int prot,int flags,int fd,off_t offset); 

返回 : 者 成 功 则 为 被 映射 区 的 起 始 地 址 ， 考 出 错 则 为 
MAP FAILED 

其 中 addr 可 以 指定 搬 述 符 fd 应 个 映 冉 到 的 进程 内 空间 的 起 始 地 址 。 
它 通 党 被 指定 为 一 个 空 指针 ， 这 样 告诉 内 核 目 己 去 选择 起 始 地 址 。 无 
论 哪 种 情况 下 ， 该 函数 的 返回 值 都 是 摘 述 符 fd 所 映射 到 内 存 区 的 起 始 地 
Hr 

lenzé Bi 5 Bl 58] Fl ERE HL as [R] FR ROSEO XA, ERT SCTEZT A 
起 第 offset 个 字 节 处 开始 算 。offset 通 常设 置 为 0。 图 12-6 展 示 了 这 个 映射 


进程 地 址 空间 
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映射 部 分 


mmap 的 返回 值 
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1 
文件 的 内 丰 
通过 描述 符 向 访问 的 文件 ; TN 映射 部 分 a 


图 12-6 内 存 映 射 文件 的 例子 


内 存 映 射 区 的 保护 由 prot 参 数 指定 ， 它 使 用 图 12-7 中 的 常 值 。 该 参 
数 的 常见 值 是 代表 读 写 访问 的 PROT_READ | PROT. WRITE ° 


PROT READ 数据 可 读 


PROT WRITE 数据 可 写 
PROT EXEC 数据 可 执行 
PROT NONE 数据 不 可 访问 


图 12-7 mmap 的 prot 参 数 


flags 使 用 图 12-8 中 的 常 值 指 定 。 MAP_SHARED 或 MAP_PRIVATE 
这 两 个 标志 必须 指定 一 个 ， 并 可 有 选择 地 或 上 MAP_FIXED。 如 采 指 定 


了 MAP_PRIVAIE， 那 么 调用 进程 对 被 映 映 数据 所 作 的 修改 只 对 该 进程 
可 见 ， 而 不 改变 其 底层 文 撑 对 象 (或 者 是 一 个 文件 对 象 ， 或 者 是 一 个 
共享 内 存 区 对 象 ) 。 如 果 指 定 了 MAP_SHARED， 那 么 调用 进程 对 被 映 
射 数 据 所 作 的 修改 对 于 共享 该 对 象 的 所 有 进程 都 可 见 ， 而 且 确 实 改变 
了 其 底层 文 撑 对 象 。 


MAP SHARED 恋 动 是 共享 的 


FE 7 a E 


MAP PRIVATE | 变动 是 私自 的 
PST 准确 地 解释 addr 参 数 


图 12-8 mmap 的 flags 参 数 

从 移植 性 上 考虑 ，MAP_FIXED 不 应 该 指定 。 如 果 没 有 指定 该 标 
志 ， 但 是 addr 不 是 一 个 空 指针 ， 那 么 addr 如 何 处 置 取决 于 实现 。 不 为 空 
的 addr 值 通常 被 当 作 有 关 该 内 存 区 应 如 何 具体 定位 的 线索 。 可 移植 的 代 
码 应 把 addr 指 定 成 一 个 空 指针 ， 并 且 不 指定 MAP_FIXED。 

父子 进程 之 间 共 享 内 存 区 的 方法 之 一 是 ， 父 进程 在 调用 fork 前 先 指 
定 MAP_SHARED 调 用 mmap。 Posix.1 保 证 父 进程 中 的 内 存 映 射 关 系 存 
留 到 子 进程 中 。 而 且 父 进程 所 作 的 修改 子 进 程 能 看 到 ， 反 过 来 也 一 
样 。 我 们 稍 后 将 给 出 这 样 的 一 个 例子 。 

mmap 成 功 返 回 后 ，fd 参 数 可 以 天 闭 。 该 操作 对 于 由 mmap 建 立 的 映 
射 关系 没有 影响 。 

为 从 某 个 进程 的 地 址 空间 删除 一 个 映射 和 关系 ， 我 们 调用 munmap。 


#include <sys/mman.h> 


int munmap(void *addr,size_t len); 


返回 : AAW AO, AEEA- 


其 中 addr 参 数 是 由 mmap 返 回 的 地 址 ，len 是 映射 区 的 大 小 。 再 次 访 
问 这 些 地 址 将 导致 向 调用 进程 产生 一 个 SIGSEGV 信 号 (当然 这 里 假设 
以 后 的 mmap 调 用 并 不 重用 这 部 分 地 址 空间 ) 。 

如 果 被 映射 区 是 使 用 MAP_PRIVATE 标 志 映 射 的 ， 那 么 调用 进程 对 
它 所 作 的 变动 都 会 被 丢弃 掉 。 

在 图 12-6 中 ， 内 核 的 虚拟 内 存 算法 保持 内 存 映射 文件 (一 般 在 人 硬盘 
E) 与 内 存 映射 区 (在 内 存 中 ) 的 同步 ， 前 提 是 它 是 一 个 
MAP_SHARED 内 存 区 。 这 就 是 说 ， 如 采 我 们 修改 了 处 于 内 存 映射 到 某 
个 文件 的 内 存 区 中 某 个 位 置 的 内 容 ， 那 么 内 核 将 在 稍 后 某 个 时 刻 相应 
地 更 新 文件 。 然 而 有 时 候 我 们 希望 确信 硬盘 上 的 文件 内 容 与 内 存 映射 
区 中 的 内 容 一 致 ， 于 是 调用 msync 来 执行 这 种 同步 。 


#include <sys/mman.h> 


int msync(void *addr,size_t len, int flags); 
返回 : EKDIK, AEEA- 
ECR addr#len 2 BUH 7$ fa (UA Pa AN RX, At th RT 
以 指定 该 内 存 区 的 一 个 子 集 。flags 参 数 是 图 12-9 中 所 示 各 常 值 的 组 合 。 


MS_ASYNC 执行 异步 写 


ME 执行 同步 写 
MS INVALIDATE | 。 使 高 速 缓存 的 数据 失效 


图 12-9 msync 函 数 的 flags 人 参数 

MS_ASYNC 和 MS_SYNC 这 两 个 常 值 中 必须 指定 一 个 ， 但 不 能 都 指 
定 。 它 们 的 差别 是 ， 一 旦 写 操 作 已 由 内 核 排 入 队列 ，MS_ASYNC 即 返 
回 ， 而 MS_SYNC 则 要 等 到 写 操 作 完 成 后 才 返 回 。 如 果 还 指定 了 


MS_INVALIDAIE， 那 么 与 其 最 终 副 本 不 一 致 的 文件 数据 的 所 有 内 存 中 
副本 都 失效 。 后 续 的 引用 将 从 文件 中 取得 数据 。 

为 何 使 用 mmap 

到 此 为 止 承 mmap 的 描述 间接 说 明了 内 存 映射 文件 : 我 们 open 它 之 
后 调用 mmap 把 它 映 射 到 调用 进程 地 址 空间 的 某 个 文件 。 使 用 内 存 映 射 
文件 所 得 到 的 奇妙 特性 是 ， 所 有 的 IO 都 在 内 核 的 掩盖 下 完成 ， 我 们 只 
需 编写 存 取 内 存 映射 区 中 各 个 值 的 代码 。 [2] 我 们 决 不 调用 read 、write 
或 lseek。 这 么 一 来 往往 可 以 简化 我 们 的 代码 。 

回想 使 用 mmap 完 成 的 Posix 消 息 队 列 的 实现 ， 其 中 图 5-30 有 往 内 存 
映射 区 中 某 个 msg_hdr 结 构 存 入 值 的 代码 ， 图 5-32 有 从 内 存 映 射 区 中 茶 
个 msg_hdr 结 构 取 出 值 的 代码 。 

然而 需要 了 解 以 防 误解 的 说 明 是 ， 不 是 所 有 文件 都 能 进行 内 存 映 
射 。 例 如 ， 试 图 把 一 个 访问 终端 或 套 接 字 的 描述 符 映 射 到 内 存 将 导致 
mmap 返 回 一 个 错误 。 这 些 类 型 的 描述 符 必须 使 用 read 和 write (或 者 它 
们 的 变 体 ) 来 访问 。 

mmap 的 男 一 个 用 途 是 在 无 亲缘 关系 的 进程 间 提 供 共 享 的 内 存 区 。 
这 种 情形 下 ， 所 映射 文件 的 实际 内 容 成 了 被 共享 内 存 区 的 初始 内 容 ， 
而 且 这 些 进程 对 该 共享 内 存 区 所 作 的 任何 变动 都 复制 回 所 映射 的 文件 
: 


以 提供 随 文件 系统 的 持续 性 ) 。 这 里 假设 指定 了 MAP_SHARED 标 
， 它 是 进程 间 共 享 内 存 所 需求 的 。 

有 关 mmap 的 实现 以 及 它 与 内 核 虚拟 内 存 算法 之 间 的 关系 具体 参见 
| McKusick et al.1996] 《适用 于 4.4BSD) 以 及 [vahalia 1996| 和 
[Goodheart and Cox 1994| (适用 于 SVR4) 。 


12.3 中 给 计数 器 持续 加 1 


现在 对 〈 不 工作 的 ) 图 12-3 进 行 修改 ， 以 使 父子 进程 共享 存放 着 计 
数 如 的 一 个 内 存 区 。 为 此 目的 ， 我 们 使 用 一 个 内 存 映 册 文 件 ， 我 们 open 


它 之 后 调用 mmap 把 它 映射 到 调用 进程 地 址 空间 的 某 个 文件 。 图 12-10 给 
出 了 这 个 新 程序 。 

新 的 命令 行 参数 

11-14 新 增 的 命令 行 参数 是 有 答 内 存 映射 的 一 个 文件 的 名 子 。 我 
们 打开 该 文件 用 于 读 和 写 ， 若 不 存在 则 创建 之 ， 然 后 写 一 个 值 为 0 的 整 
数 到 该 文件 中 。 

mmap 后 关闭 描述 符 

15~16 调用 mmap 把 刚才 打开 的 文件 映射 到 本 进程 的 内 存 空 间 。 人 第 
一 个 参数 是 一 个 空 指 针 ， 因 而 由 系统 来 选择 起 始 地 址 。 长 度 参 数 是 一 
个 int 的 大 小 ， 保 扩 模 式 参 数 指定 读 写 访问 。 

通过 把 第 四 个 参数 指定 为 MAP_SHARED， 父 进程 所 作 的 任何 变动 
子 进程 都 能 看 到 ， 反 过 来 也 一 样 。 函 数 返 回 值 是 竺 共享 内 存 区 的 起 始 
地 址 ， 我 们 把 它 保存 在 ptr 中 。 

fork 

20~34 把 标准 输出 设置 成 非 组 冲模 式 后 调用 fork。 父 于 进程 都 要 对 
由 ptr 指 疝 的 整数 计数 器 执行 加 1 操作 。 


shm/incr2.c 


1 #include "unpipc.h" 

2 #define SEM NAME "mysem" 

3 int 

4 main(int argc, char **argv) 

S 4 

6 int fd, i, nloop, zero = 0; 

7 int *ptr; 

8 sem_t *mutex; 

9 if (argc != 3) 

10 err quit("usage: incr2 «pathname» <#loops>") ; 

11 nloop = atoi(argv[2]); 

12 /* open file, initialize to 0, map into memory */ 
13 fd = Open(argv[1], O RDWR | O CREAT, FILE MODE); 

14 Write(fd, &zero, sizeof(int)); 

15 ptr - Mmap(NULL, sizeof(int), PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
16 Close (fd) ; 

17 /* create, initialize, and unlink semaphore */ 

18 mutex - Sem open(Px ipc name(SEM NAME), O CREAT | O EXCL, FILE MODE, 1); 
19 Sem unlink(Px ipc name(SEM NAME)); 

20 setbuf (stdout, NULL); /* stdout is unbuffered */ 
21 if (Fork() == 0) { /* child */ 

22 for (i = 0; i < nloop; i++) { 

23 Sem_wait (mutex) ; 

24 printf ("child: d\n", (*ptr)++); 

25 Sem_post (mutex) ; 

26 } 

27 exit (0) ; 

28 } 

29 /* parent */ 

30 for (i = 0; i < nloop; i++) { 

31 Sem_wait (mutex) ; 

32 printf ("parent: $dWMn", (*ptr)++); 

33 Sem_post (mutex) ; 

34 } 

35 exit (0); 

36 } 


shm/incr2.c 


图 12-10 父子 进程 给 共享 内 存 区 中 的 一 个 计数 器 加 1 

fork 对 内 存 映 射 文件 进行 特殊 处 理 ， 也 就 是 父 进程 在 调用 fork 之 前 

创建 的 内 存 映射 关系 由 子 进 程 共 享 。 因 此 ， 我 们 刚才 在 打开 文件 后 以 

MAP_SHARED 标 志 调 用 mmap 的 操作 实际 上 提供 了 一 个 由 父子 进程 共 

享 的 内 存 区 。 而 且 ， 有 既然 该 共享 内 存 区 是 一 个 内 存 映射 文件 ， 因 而 对 

E (由 ptr 指 向 的 大 小 为 sizeof(int) 的 内 存 区 ) 所 作 的 任何 变动 还 会 反映 
到 真正 的 文件 中 (该 文件 的 名 字 由 命令 行 参 数 指定 ) 。 


执行 这 个 程序 ， 我 们 发 现 由 ptr 指 向 的 内 存 区 确实 在 父子 进程 间 共 
享 。 下 面 只 给 出 内 核 在 这 两 个 进程 间 来 回 切换 上 下 文 时 输出 的 值 。 

solaris 96 incr2 /tmp/temp.1 10000 

child: 0 子 进 程 首先 运行 

child: 1 


child: 128 solaris % od -D /tmp/temp.1 

0000000 0000020000 

0000004 

parent: 130 子 进 程 被 阻止 ， 父 进程 启动 

child: 638 父 进程 被 阻止 ， 子 进程 接 
TT 

parent: 1519 子 进程 被 阻止 ， 父 进程 接 
TT 

parent: 19999 最 后 一 行 输出 

parent: 1520 child: 1517 

child: 1518 

child: 639 parent: 636 

parent: 637 

parent: 131 

child: 129 


既然 文件 /tmp/temp.1 已 被 内 存 上 映射 ，incr2 程 序 运行 终止 后 我 们 可 以 
用 od 程序 查看 该 文件 的 内 容 ， 发 现 其 中 确实 存放 着 计数 器 的 最 终 值 
(20000) 。 


图 12-11 是 对 图 12-5 的 修改 ， 它 画 出 了 共享 内 存 区 ， 并 表示 出 信和 号 


量 也 十 共 译 的 。 这 里 的 信号 量 


男 成 是 在 内 核 中 ， 然 而 正如 我 们 讲述 


Posix 信 号 量 时 所 到 的 那样 ， 这 并 不 是 必须 的 。 不 论 使 用 什么 来 实现 ， 


22 B, E. 


EJE 


必须 至 少 具 有 随 内 核 的 持续 性 。 如 10.15 节 所 展示 的 那样 ， 该 信 


号 量 也 可 作为 另 一 个 内 存 映 射 文件 存放 。 


^3 imi 


int *ptr; 


if (Fork() == O) ( 
/* child */ 


) 


父 进程 在 
这 里 执行 


/* parent */ 
— “ee 


共享 内 存 区 
计数 器 


子 进程 


int *ptr; 


if (Fork() == 0) ( 
/* child */ 


子 进 程 在 
这 里 执行 


) 


/* parent */ 


图 12-11 共享 一 个 内 存 


区 和 一 个 信号 量 的 父子 进程 


图 中 国 出 父子 进程 都 各 目 有 属于 目 己 的 指针 ptr 的 副本 ， 但 是 每 个 
副本 都 指向 共享 内 存 区 中 的 同一 个 整数 : 这 两 个 进程 都 对 它 执行 加 1 操 


作 的 计数 器 。 


现在 把 图 12-10 中 的 程序 改 为 使 用 一 个 Posix 基 于 内 存 的 信号 量 ， 
不 是 一 个 Posix 有 名 信号 量 ， 并 把 该 信号 量 


12 给 出 了 这 个 新 程序 。 


" 
存放 在 共享 内 存 区 中 。 图 12- 


定义 将 存放 在 共享 内 存 区 中 的 结构 
2~5 定义 一 个 结构 ， 其 中 含有 整数 计数 器 以 及 保护 它 的 信号 量 。 
该 结构 将 存放 到 共享 内 存 区 对 象 中 。 


shm/incr3.c 


1 #include "unpipc.h" 


2 struct shared { 


3 sem t mutex; /* the mutex: a Posix memory-based semaphore */ 
4 int count; /* and the counter */ 
5 } shared; 
6 int 
7 main(int argc, char **argv) 
8 { 
9 int fd, 1; nloop; 
10 struct shared *ptr; 
11 if (argo he 3) 
12 err quit ("usage: incr3 <pathname> <#loops>") ; 
13 nloop = atoi(argv[21); 
14 /* open file, initialize to 0, map into memory */ 
15 fd = Open(argv[1], O_RDWR | O CREAT, FILE MODE) ; 
16 Write(fd, &shared, sizeof (struct shared) ); 
17 ptr = Mmap (NULL, sizeof(struct shared), PROT READ | PROT WRITE, 
18 MAP SHARED, fd, 0); 
19 Close (fd) ; 
20 /* initialize semaphore that is shared between processes */ 
2l Sem init(&ptr-»mutex, 1, 1); 
22 setbuf (stdout, NULL); /* stdout is unbuffered */ 
23 if (Fork() == 0) { /* child */ 
24 for (i = 0; i « nloop; i++) { 
25 Sem_wait (&ptr->mutex) ; 
26 printf ("child: %d\n", ptr->count++) ; 
27 Sem post (&ptr->mutex) ; 
28 } 
29 exit (0); 
30 } 
31 /* parent */ 
32 for (i = 0; i < nloop; i++) { 
33 Sem wait (&ptr->mutex) ; 
34 printf ("parent: %d\n", ptr->count++) ; 
35 Sem_post (&ptr->mutex) ; 
36 } 
37 exit (0); 
38 } 
shm/incr3.c 
图 12-12 计数 器 和 信号 量 都 在 共享 内 存 区 中 


映射 到 内 存 

14~19 创建 一 个 将 被 映射 到 内 存 的 文件 ， 将 一 个 值 为 0 的 上 述 结构 
写 到 该 文件 中 。 我 们 所 做 的 只 是 初始 化 其 中 的 计数 舌 ， 因 为 信号 量 的 
值 古 通过 调用 sem_init 初 始 化 的 。 然 而 把 整个 结构 写成 0 要 比试 图 只 写 一 
个 值 为 0 的 整数 容易 。 


初始 化 信和 号 量 

207-21 现在 是 用 一 个 基于 内 存 的 信号 量 代 蔡 一 个 有 名 信号 量 ， 因 
此 我 们 调用 sem_init 把 它 的 值 初始 化 为 1。 第 二 个 参数 必须 不 为 0， 以 指 
示 该 信号 量 将 在 进程 间 共 享 。 

图 12-13 是 对 图 12-11 的 修改 ， 注 意 其 中 的 信号 量 已 从 内 核 挪 到 了 共 
享 内 存 区 中 。 


共享 内 存 区 
计数 器 及 其 信号 量 


A> ie Fa 


子 进程 


struct shared *ptr; struct shared *ptr; 


if (Fork() == 0) { 
/* child */ 


if (Fork() == 0) { 
p* chvid, 5/ 


子 进 程 在 
这 里 执行 


) ) 


父 进程 在 /* parent */ /* parent */ 


这 里 执行 


图 12-13 现在 计数 器 和 信号 量 都 在 共享 内 存 区 中 


12.4 4.4BSD 匿 名 内 存 映 射 


图 12-10 和 图 12-12 中 的 例子 程序 工作 正确 ， 然 而 我 们 不 得 不 在 文件 
系统 中 创建 一 个 文件 《其 名 字 由 命令 行 参数 给 出 ) ， 调 用 open， 人 然后 往 
该 文件 中 write 一 些 0 以 初始 化 它 。 如 果 调 用 mmap 的 目的 是 提供 一 个 将 
穿越 fork 由 父子 进程 共享 的 映射 内 存 区 ， 那 么 我 们 可 以 简化 上 述 情 形 ， 
具体 方法 取决 于 实现 。 

(1)4.4BSD 提 供 匿 名 内 存 映 射 (anonymous memory mapping) , © 
彻底 避免 了 文件 的 创建 和 打开 。 其 办 法 是 把 mmap 的 flags 参 数 指定 成 
MAP SHARED | MAP_ANON ， 把 fd 参数 指定 为 -1。offset 参 数 则 被 忽 
略 。 这 样 的 内 存 区 初始 化 为 0° 我 们 将 在 图 12-14 中 给 出 这 种 内 存 映 射 的 
—^MBIT. ° 


(2)SVR4 提 供 /dev/zero 设 备 文件 ， 我 们 open 它 之 后 可 在 mmap 调 用 中 
使 用 得 到 的 描述 符 。 从 该 设备 读 时 返回 的 字 节 全 为 0， 写 往 该 设备 的 任 
何 字 节 则 被 丢弃 。 我 们 将 在 图 12-15 中 给 出 使 用 该 设备 进行 内 存 映射 的 
一 个 例子 。 (许多 源 自 Berkeley 的 实现 也 支持 /dev/zero， 例 如 SunOS 
4.1.x 和 BSD/OS 3.1 ° ) 

图 12-14 给 出 了 改 用 4.4BSD 匿 名 内 存 映射 后 ， 与 图 12-10 中 程序 相 比 
唯一 有 变动 的 部 分 。 


shm/incr map anon.c 


3) int 
4 main(int argc, char **argv) 


6 int i, nloop; 

y int *ptr; 

8 sem t *mutex; 

9 if (argc !- 2) 

10 err quit("usage: incr map anon <#loops>") ; 

11 nloop = atoi(argv[1]); 

12 /* map into memory */ 

13 ptr - Mmap(NULL, sizeof(int), PROT READ | PROT WRITE, 
14 MAP SHARED | MAP ANON, -1, 0); 


shm/incr map anon.c 


[12-14 4.4BSD 匿 名 内 存 映射 

6~1l 目 动 变量 ft 和 zero， 以 及 指定 待 创建 路 径 名 的 命令 行 参 数 都 
WET TI ° 

12~ 14 我们 不 再 open 一 个 文件 。 在 调用 mmap 时 指定 了 
MAP_ANON 标 志 ， 并 置 第 五 个 参数 (描述 符 ) 为 -1。 


12.5 SVR4 /dewzero 内 存 映 射 


图 12-15 给 出 了 改 为 映射 /dev/zero 后 与 图 12-10 中 程序 相 比 唯一 有 变 


动 部 分 。 


shm/incr dev zero.c 


3 int 
4 main(int argc, char **argv) 


6 int fd, i, nloop; 

7 int ptr 

8 sem t mutex 

9 if (argc != 2) 

10 err quit("usage: incr dev zero <#loops>") ; 

11 nloop = atoi(argv[1]); 

12 /* open /dev/zero, map into memory */ 

13 fd - Open("/dev/zero", O RDWR); 

14 ptr - Mmap(NULL, sizeof(int), PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
15 Close (fd); 


shm/incr. dev zero.c 


[12-15 SVRA /dev/zero 内 存 映 射 

6~11 目 动 变量 zero 以 及 指定 繁 创 建 路 径 名 的 命令 行 参数 都 个 去 挥 
了 。 

127-15 open 文 件 /dev/zero 后 把 得 到 的 描述 符 用 于 mmap 调 用 中 。 这 
样 的 映射 保证 内 存 映 射 区 被 初始 化 为 0。 


12.6 Jj iR 映射 的 天 


内 存 映射 一 个 普通 文件 时 ， 内 存 中 映射 区 的 大 小 (mmap 的 第 二 个 
BN) 通常 等 于 该 文件 的 大 小 。 例 如 图 12-12 中 ， 文 件 大 小 由 write 设 置 
成 我 们 的 shared 结 构 的 大 小 ， 它 同时 也 是 内 存 映射 区 的 大 小 。 然 而 文件 
大 小 和 内 存 映射 区 大 小 可 以 不 同 。 

我 们 将 使 用 图 12-16 给 出 的 程序 更 为 细致 地 探讨 mmap 函 数 。 

命令 行 参 数 

8 一 11 命令 行 参 数 有 三 个 ， 分 别 指定 即将 创建 并 映射 到 内 存 的 文件 
的 路 径 名 、 该 文件 将 被 设置 成 的 大 小 以 及 内 存 映射 区 的 大 小 。 

创建 、 打 开 并 截 短 文件 ， 设 置 文件 大 小 

127-15 每 打开 的 文件 若 不 存在 则 创建 之 ， 若 已 存在 则 把 它 的 大 小 
截 短 成 0。 接着 把 该 文件 的 大 小 设置 成 由 命令 行 参数 指定 的 大 小 ， 办 法 


征 把 文件 读 写 指针 移动 到 这 个 大 小 城 去 1 的 字 万 位置， 然后 写 1 个 字 
+H 。 

内 存 映 射 文件 

16~17 使 用 作为 最 后 一 个 命令 行 参数 指定 的 大 小 对 该 文件 进行 内 
存 有 映射 。 其 描述 符 随 后 被 天 闭 。 

输出 页 面 大 小 

18~19 使 用 sysconf 获 取 系 统 实现 的 页 面 大 小 并 将 其 输出 。 

读 出 和 存 入 内 存 映射 区 

20~26 HATA KPa SDS, HE 
们 的 值 。 我 们 预期 这 些 值 全 为 0。 同时 把 每 个 页 面 的 这 两 个 字 节 设置 为 
1° 我 们 预期 某 个 引用 会 最 终 引 发 一 个 信号 ， 它 将 终止 程序 。 当 for 循 环 
结束 时 ， 我 们 输出 下 一 页 的 首 字 市 ， 并 预期 这 会 失败 (假设 

此 前 程序 还 没有 失败 ) 。 


shm/testl.c 


1 #include "unpipc.h" 

2 dint 

3 main(int argc, char **argv) 

x d 

5 int fd; das 

6 char *ptr; 

7 size t filesize, mmapsize, pagesize; 

8 if (argc != 4) 

9 err quit("usage: testl <pathname> <filesize> «mmapsize»"); 
10 filesize = atoi(argv[21); 

11 mmapsize = atoi (argv[31); 

12 /* open file: create or truncate; set file size */ 

13 fd - Open(argv[1], O RDWR | O CREAT | O TRUNC, FILE MODE); 

14 Lseek(fd, filesize-1, SEEK SET); 

15 Write(fd, "", 1); 

16 ptr - Mmap(NULL, mmapsize, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
I3 Close (fd) ; 

18 pagesize = Sysconf( SC PAGESIZE); 

19 printf("PAGESIZE = %ld\n", (long) pagesize); 

20 for (i = 0; i « max(filesize, mmapsize); i += pagesize) { 

21 printf("ptr[$d] = $dWMn", i, ptr[il); 

22 HEE) = ws 

23 printf("ptr[$d] = %d\n", i + pagesize - 1, ptr[i + pagesize - 11); 
24 ptr[i + pagesize - 1] = 1; 

25 ) 

26 printf("ptr[$d] = $dWMn", i, ptrlil); 

27 exit(0); 

28 ) 


shm/testl.c 


112-16 访问 其 大 小 可 能 不 同 于 文件 大 小 的 内 存 映 射 区 


我 们 要 展示 的 第 一 种 情形 的 前 提 是 : 文件 大 小 等 于 内 存 映 射 区 大 
但 这 个 大 小 不 是 页 面 大 小 的 倍数 。 

solaris 96 ls -l foo 

foo: No such file or directory 

solaris 96 test1 foo 5000 5000 

PAGESIZE - 4096 

ptr[0] = 0 

ptr[4095] = 0 

ptr[4096] = 0 

ptr[8191] = 0 


Segmentation Fault(coredump) 

solaris % ls -] foo 

-rw-r--r-- 1 rstevens other1 5000 Mar 20 17:18 foo solaris 96 
od -b -A d foo 

0000000 001 000 000 000 000 000 000 000 000 000 000 000 000 000 
000 000 

0000016 000 000 000 000 000 000 000 000 000 000 000 000 000 000 
000 000 

* 

0004080 000 000 000 000 000 000 000 000 000 000 000 000 000 000 
000 001 

0004096 001 000 000 000 000 000 000 000 000 000 000 000 000 000 
000 000 

0004112 000 000 000 000 000 000 000 000 000 000 000 000 000 000 
000 000 

* 

0005000 

页 面 大 小 为 4096 字 节 ， 我 们 能 够 读 完整 的 第 2 页 (下 标 为 4096 一 
8191) ， 但 是 访问 第 3 页 时 (下 标 为 8192) 引发 SIGSEGV 信 号 ，shell 将 
它 输出 成 <Segmentation Fault (分 段 故 障 ) ”。 尽 管 我 们 把 ptr[8191] 设 置 
成 1， 它 也 不 写 到 foo 文 件 中 ， 因 而 该 文件 的 大 小 仍然 是 5000。 内 核 允许 
我 们 读 写 最 后 一 页 中 映射 区 以 远 部 分 (内 核 的 内 存 保 护 是 以 页 面 为 单 
位 的 ) 。 但 是 我 们 写 向 这 部 分 扩展 区 的 任何 内 容 都 不 会 写 到 foo 文 件 
中 。 设 置 成 1 的 其 他 3 个 字 节 (下 标 分 别 为 0、4905 和 4906) 复制 回 foo 文 
件 ， 这 一 点 可 使 用 od 命 令 来 验证 。 (〈-b 选 项 指定 以 八进制 数 输出 各 个 字 
节 ，-A d 选 项 指定 以 十 进 制 数 输出 地 址 。) 图 12-17 展 示 了 这 个 例子 。 


文件 大 小 


Xf 
fte: 0 4999 


Fin: 0 4999 5000 8191 


~ — ~ ~ ~ — 
5 ; 最 后 一 页 | 
为 存 ijt Ék 
和 剩余 部 分 I 


ocksd qoM 访问 引发 
M——-— 访问 不 出 问题 一 -一 一 -一 = SIGSEGV 
i 信号 
mmap () 大 小 
图 12-17 mmap 大 小 等 于 文件 大 小 时 的 内 存 映 射 

在 Digital Unix 下 运行 同样 的 例子 ， 得 到 的 结果 类 似 ， 不 过 页 面 大 
小 现在 是 8192 字 节 。 

alpha 96 ls -l foo 

foo not found 

alpha 96 test1 foo 5000 5000 

PAGESIZE - 8192 

ptr[0] = 0 

ptr[8191] = 0 

Memory fault(coredump) 

alpha 96 ls -l foo 

-IW-r--r-- 1 rstevens operator 5000 Mar 21 08:40 foo 

TAE US TASE VS IAA ER DX Debora Re Te APT EP 
个 内 存 页 面 内 〈 下 标 为 5000~8191) 。 访 问 ptr[8192] 将 引发 SIGSEGV 


信号 ， 这 是 我 们 预期 的 。 

在 执行 图 12-16 所 示 程 序 的 下 一 个 例子 中 ， 我 们 把 内 存 映 射 区 大 小 

(15000 字 节 ) 指定 成 大 于 文件 大 小 (5000 字 节 ) ° 

solaris % rm foo 

solaris 96 test1 foo 5000 15000 

PAGESIZE = 4096 

ptr[0] = 0 

ptr[4095] = 0 

ptr[4096] = 0 

ptr[8191] = 0 

Bus Error(coredump) 

solaris % ls -] foo 

-rw-r--r-- 1 rstevens other1 5000 Mar 20 17:37 foo 

其 结果 与 先前 那个 文件 大 小 等 于 内 存 映射 区 大 小 (都 是 5000 字 
节 ) 的 例子 类 似 。 本 例子 引发 SIGBUS 信 号 (其 shell 输 出 为 “Bus Error 

(总 线 出 错 ) ") ， 前 一 个 例子 则 引发 SIGSEGV 信 号。 两 者 的 差别 是 ， 

SIGBUS 意 味 大 我们 是 在 内 存 上 映射 区 内 访问 ,但 是 已 超出 了 上 的 层 文 撑 对 
象 的 大 小 。 上 一 个 例子 中 的 SIGSEGV 则 意味 着 我 们 已 在 内 存 映射 区 以 
远 访 问 。 可 以 看 出 ， 内 核 知道 被 映射 的 底层 文 撑 对 象 (本 例子 中 为 文 
件 foo) 的 大 小 ， 即 使 该 对 象 的 描述 符 已 经 关闭 也 一 样 。 内 核 允许 我 们 
给 mmap 指 定 一 个 大 于 该 对 象 大 小 的 大 小 参数 ， 但 是 我 们 访问 不 了 该 对 
象 以 远 的 部 分 (最 后 一 页 上 该 对 象 以 远 的 那些 字 市 除外 ， 它 们 的 下 标 
235000--8191) 。 图 12-18 展 示 了 这 个 例子 。 


文件 大 小 


文件 
偏 移 : 0 4999 mmap () 大 小 
下 标 : 0 4999 5000 _ _ 8191_8192 14999 
所 有 页 
_ 剩 余部 分 _ 


访问 引发 
^ 访问 不 出 问题 ——— eJ —— SIGBUS 一 一 “= SIGSEGV 
信和 号 


HUY 


图 12-18 mmap 大 小 超过 文件 大 小 时 的 内 存 映 射 


图 12-19 给 出 了 我 们 的 下 一 个 程序 。 它 展示 了 处 理 一 个 持续 增长 的 
文件 的 一 种 萌 用 技巧 : 指定 一 个 大 于 该 文件 大 小 的 内 存 映 映 区 大 小 ， 
跟踪 该 文件 的 当前 大 小 《以 确保 不 访问 当前 文件 尾 以 远 的 部 分 ) ， 然 
后 束 让 该 文件 的 大 小 随 着 往 其 中 每 次 写 入 数据 而 增长 。 


shm/test2.c 


1 #include "unpipc.h" 


2 #define FILE "test.data" 
3 #define SIZE 32768 


4 int 

5 main(int argc, char **argv) 

6 

7 int fd, i; 

8 char *ptr; 

9 /* open: create or truncate; then mmap file */ 

10 fd - Open(FILE, O RDWR | O CREAT | O TRUNC, FILE MODE); 
alii ptr - Mmap(NULL, SIZE, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
12 for (i = 4096; i <= SIZE; i += 4096) ( 

13 printf ("setting file size to %d\n", i); 

14 Ftruncate(fd, i); 

15 printf ("ptr[%d] = $dWMn", i-1, ptr[i-1]); 

16 } 

17 exit (0) ; 

18 } 


shm/test2.c 


图 12-19 允许 文件 大 小 增长 的 内 存 映 射 区 例子 


打开 文件 


大 小 


Eu 


所 建 


9~11 打开 一 个 文件 ， 若 不 存在 则 创建 之 ， 若 已 存在 则 把 它 截 短 成 
为 0。 以 32768 字 节 的 

大 小 对 该 文件 进行 内 存 上 映射， 尽管 它 当 前 的 大 小 为 0。 

增长 文件 大 小 

12~16 通过 调用 ftruncate (13.319). 把 该 文件 的 大 小 每 次 增长 4096 
然后 取出 现在 是 该 文件 最 后 一 个 字 节 的 那个 字 节 。 
现在 运行 这 个 程序 ， 我 们 看 到 随 着 文件 大 小 的 增长 ， 我 们 能 通过 
立 的 内 存 映射 区 访问 新 的 数据 。 


alpha 96 ls -l test.data 


test.data: No such file or directory 
alpha % test2 

setting file size to 4096 
ptr[4095] = 0 

setting file size to 8192 
ptr[8191] = 0 

setting file size to 12288 
ptr[12287] = 0 

setting file size to 16384 
ptr[16383] = 0 

setting file size to 20480 
ptr[20479] = 0 

setting file size to 24576 
ptr[24575] = 0 

setting file size to 28672 
ptr[28671] = 0 

setting file size to 32768 
ptr[32767] = 0 


alpha 96 ls -| test.data 

-rw-r--r-- 1 rstevens other1 32768 Mar 20 17:53 test.data 

本 例子 表明 ， 内 核 跟 踪 着 被 内 存 映 射 的 确 层 文 撑 对 象 (本 例子 中 
为 文件 test.data) 的 大 小 ， 而 且 我 们 总 是 能 访问 在 当前 文件 大 小 以 内 又 
在 内 存 映 射 区 以 内 的 那些 字 节 。 在 Sloaris 2.6 下 我 们 取得 了 同样 的 结 
果 o 

本 节 处 理 的 是 内 存 上 映射 文件 和 mmap。 习题 13.1 中 我 们 要 求 把 这 两 
个 程序 改 为 处 理 Posix 共 至 内 存 区 ， 将 看 到 相同 的 结果 © 


12.7 小 结 


共享 内 存 区 是 可 用 IPC 形 式 中 最 快 的 ， 因 为 共享 内 存 区 中 的 单个 数 
据 副 本 对 于 共 至 该 内 存 区 的 所 有 线程 或 进程 都 是 可 用 的 。 然 而 为 协调 
共享 该 内 存 区 的 各 个 线程 或 进程 ,通常 需要 某 种 形式 的 同步 。 

本 章 集 中 于 mmap 函 数 以 及 普通 文件 的 内 存 上 映射， 因为 这 是 有 亲缘 
关系 的 进程 间 共 享 内 存 空间 的 一 种 方法 。 一 旦 内 存 映 射 了 一 个 文件 ， 
我 们 就 不 再 使 用 read、write 和 1lseek 来 访问 该 文件 ， 而 只 是 存 取 已 由 
mmap 了 映射 到 该 文件 的 内 存 位 置 。 把 显 式 的 文件 WO 操作 变换 成 存 取 内 存 
单元 往往 能 够 简化 我 们 的 程序 ， 有 时 候 还 能 改善 性 能 。 

如 有 果 设 置 共享 内 存 区 的 目的 是 为 了 穿越 某 个 后 续 的 fork 在 父子 进程 
间 共 享 它 ， 那 么 通过 使 用 匿名 内 存 映 射 可 简化 其 步 骆 ， 这 样 就 不 需要 
创建 一 个 待 映 射 的 普通 文件 。 这 里 或 者 涉及 MAP_ANON 这 个 新 标志 

(适用 于 源 自 Berkeley 的 内 核 ) ， 或 者 涉及 /devwzero 设 备 文件 的 映射 
(适用 于 源 自 SVR4 的 内 核 ) 。 

我 们 如 此 详尽 地 讨论 mmap 的 理由 有 两 个 : 一 是 文件 的 内 存 映射 是 
一 种 很 有 用 的 技巧 ， 二 是 Posix 共 享 内 存 区 也 使 用 mmap， 它 是 下 一 章 的 
主题 。 


Posix 还 定义 了 (我 们 没有 讨论 过 的 ) 处 理 内 存 管理 的 4 个 额外 函 
ZW o 

mlockall 会 使 调用 进程 的 整个 内 存 空 间 常 驻 内 存 。munlockall 则 撤 
销 这 种 锁定 。 

mlock 会 使 调用 进程 地 址 空间 的 某 个 指定 范围 常 驻 内 存 ， 该 函数 的 
参数 指定 了 这 个 范围 的 起 始 地 址 以 及 从 该 地 址 算 起 的 字 市 数 。munlock 
则 撤销 某 个 指定 内 存 区 的 锁定 。 


习题 


12.1 在 图 12-19 中 ， 如 果 多 执行 一 次 for 循 环 内 的 那 段 代码 ， 那 么 会 
发 生 什么 ? 

12.2 假设 有 两 个 进程 ， 一 个 是 发 送 者 ， 一 个 是 接收 者 ， 前 者 只 是 
向 后 者 发 送 消 息 。 再 假设 它们 采用 System V 消 息 队 列 发 送 消 息 ， 请 画 出 
消息 从 发 送 者 去 往 接收 者 的 示意 图 。 现 在 假设 这 两 个 进程 采用 我 们 在 
5.8 廊 提供 的 Posix 消 恩 队 列 的 实现 来 发 送 消 息 ， 请 画 出 新 的 消息 传递 示 

12.3 在 讨论 mmap 的 MAP_SHARED 标 志 时 ， 我 们 说 过 内 核 虚 拟 内 
存 算法 将 把 对 内 存 映 像 的 任何 变动 更 独到 实际 的 文件 中 。 查 看 /dev/zero 
的 手册 页 面 ， 判 定 在 内 核 把 对 内 存 映像 的 变动 写 回 该 文件 时 ， 发 生 了 
MAS 

12.4 把 图 12-10 改 为 指定 MAP_PRIVATE 标 志 而 不 是 MAP_SHARED 
标志 ， 并 验证 其 结果 与 图 12-3 的 类 似 。 被 映射 到 内 存 的 文件 的 内 容 是 什 
入? 

12.5 在 6.9 节 中 我 们 提 到 过 ， 对 System V 消 息 队 列 select 读 写 条 件 的 
方法 之 一 是 : 创建 一 个 匿名 共享 内 存 区 ， 派 生 一 个 子 进程 ， 让 该 子 进 
程 阻塞 在 msgrcv 调 用 中 ， 以 将 消息 读 入 到 该 匿名 共享 内 存 区 中 。 父 进程 
还 创建 两 个 管道 ， 其 中 一 个 管道 由 子 进程 用 来 向 父 进程 通知 已 在 共享 
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共享 内 存 区 已 可 用 。 这 束 允 许 父 进程 对 前 一 个 管道 的 读 出 端 select 可 读 
条 件 ， 同 时 对 它 想 要 选择 的 其 他 描述 符 select 读 写 条 件 。 请 把 上 述 办 法 
编写 成 代码 。 其 中 匿名 共享 内 存 对 象 的 分 配 调用 我 们 的 my_shm 函 数 

(图 A-46) 完成 。 创 建 消息 队列 使 用 我 们 在 6.6 市 提供 的 msgcreate 和 
msgsnd 程 序 ， 然 后 把 记录 放 到 该 队列 中 。 父 进程 应 该 只 输出 由 子 进程 
读 入 的 每 个 消息 的 大 小 和 类 型 。 


第 13 章 Posix 共 享 内 存 区 


13.1 概述 


上 一 章 较 为 党 统 地 讨论 了 共享 内 存 区 以 及 mmap 函 数 ， 并 给 出 了 使 
用 mmap 提 供 父子 进程 间 的 共享 内 存 区 的 例子 : 

使 用 内 存 映 射 文 件 (图 12-10) ; 

使 用 4.4BSD 匿 名 内 存 映射 (图 12-14) ; 

使 用 /dev/zero 匿 名 内 存 映射 (图 12-15) ° 

我 们 现在 把 共享 内 存 区 的 概念 扩展 到 将 无 亲缘 关系 进程 间 共 享 的 
内 存 区 包括 在 内 。Posix.1 提 供 了 两 种 在 无 亲缘 天 系 进程 间 共 享 内 存 区 的 
THE © 

(内 存 映 射 文件 (memory-mapped file) : 由 open 函 数 打开 ， 由 
mmap 函 数 把 得 到 的 描述 符 映 射 到 当前 进程 地 址 空间 中 的 一 个 文件 。 我 
们 在 第 12 章 中 讲述 了 这 种 技术 ， 并 给 出 了 它 在 父子 进程 间 共 享 内 存 区 
时 的 用 法 。 内 存 映 射 文件 也 可 以 在 无 亲缘 关系 的 进程 间 共 享 。 

(2) 共 享 内 存 区 对 象 (shared-memory object) : 由 shm_open 打 开 一 
个 Posix.1 IPC 名 字 (也 许 是 在 文件 系统 中 的 一 个 路 径 名 ) ， 所 返回 的 描 


述 符 由 mmap 郴 数 映射 到 当前 进程 的 地 址 空间 。 我 们 将 在 本 章 讲述 这 种 
技术 。 

这 两 种 技术 都 需要 调用 mmap ， 差 别 在 于 作为 mmap 的 参数 之 一 的 
描述 符 的 获取 手段 : 通过 open 或 通过 shm_open。 图 13-1 展 示 了 这 个 差 
别 。Posix 把 两 者 合 称 为 内 存 区 对 象 (memory object) 


Posix 内 存 映 射 文件 Posix 共 享 内 存 区 对 象 
fd = open(pathname, ... ); fd - shm open(name, ... ); 
Pa 
pir = mmap ame m Ed ors Li eer = mmap( we 5 Ed; aca Lj 
Posix 内 存 区 对 象 


图 13-1 Posix 内 存 区 对 象 : 内 存 映 射 文件 和 共享 内 存 区 对 象 


13.2 shm_open#ilshm_unlink K Ži 


Posix 共 享 内 存 区 涉及 以 下 两 个 步骤 要 求 。 

(1) 指 定 一 个 名 字 参 数 调 用 shm_open， 以 创建 一 个 新 的 共享 内 存 区 
对 象 或 打开 一 个 已 存在 的 共享 内 存 区 对 象 。 

(2) 调 用 mmap 把 这 个 共享 内 存 区 映射 到 调用 进程 的 地 址 空间 。 

传递 给 shm_open 的 名 字 参 数 随后 由 希望 共享 该 内 存 区 的 任何 其 他 
进程 使 用 。 

Posix 共 享 内 存 区 采用 这 样 的 两 步 过 程 ， 而 不 是 只 用 单个 步骤 ， 即 
取得 一 个 名 字 后 直接 返回 调用 进程 内 存 空 间 中 的 某 个 地 址 ， 其 原因 在 
于 当 Posix 发 明 自 己 的 共享 内 存 区 形式 时 ，mmap 已 经 存在 。 显 然 ， 单 个 
函数 完全 可 以 做 那 两 步 工作 。shm_open 返 回 一 个 描述 符 (回想 一 下 ， 
mdq_open 返 回 一 个 mqd_t 值 sem openjk[m] — 1 $8 m 3: ^ sem. tf IJ TR 
TD) 的 原因 是 : mmap 用 于 把 一 个 内 存 区 对 象 映 射 到 调用 进程 地 址 空间 
的 是 该 对 象 的 一 个 已 打开 搞 述 符 。 


#include <sys/mman.h> 

int shm_open(const char *name,int oflag,mode t mode); 

int shm_unlink(const char *name); 

返回 : SATII SE aS, A EEA- 
返回 : BAMA, AEA- 

我 们 已 在 2.2 太 描述 过 有 关 name 参 数 的 规则 e 

oflag 参 数 必须 或 者 含有 O_RDONLY (只 读 ) 标志 ， 或 者 含有 
O_RDWR ( 读 写 ) 标志 ， 还 可 以 指定 如 下 标志 : O_CREAT、O_EXCL 
或 O TRUNC“。O_CREAT 和 O_EXCL 标 志 已 在 2.3 节 描述 过 。 如 果 随 
O_RDWR 指定 O_TRUNC 标 志 ， 而 且 所 需 的 共享 内 存 区 对 象 已 经 存在 ， 
那么 它 将 被 截 短 成 0 长 度 。 

mode 参 数 指定 权限 位 (图 2-4) ， 它 在 指定 了 O_CREAT 标 志 的 前 提 
下 使 用 。 注 意 ， 与 mq_open 和 sem_open 函 数 不 同 ，shm_open 的 mode 参 
数 总 是 必须 指定 。 如 有 果 没 有 指定 O_CREAT 标 志 ， 那 么 该 参数 可 以 指定 
为 0。 

shm_open 的 返回 值 是 一 个 整数 朱 述 符 ， 它 随后 用 作 mmap 的 第 五 个 
TW o 
shm  unlink EX 2: Jj] E — SHEA EKO RN TF o HR BUS REG 

unlink EH ax “删除 文 件 系统 中 一 个 路 径 名 的 unlink， 删 除 一 个 Posix 消 息 
队列 的 mq_unlink， 以 及 删除 一 个 Posix 有 名 信号 量 的 sem_unlink) 一 
样 ， 删 除 一 个 名 字 不 会 影响 对 于 其 确 层 文 撑 对 象 的 现 有 引用 ， 直 到 对 
于 该 对 象 的 引用 全 部 关闭 为 止 。 删 除 一 个 名 字 仅 仅 防 止 后 续 的 open、 
mq_open 或 sem_open 调 用 取得 成 功 。 


13.3 ftruncate7lfstat BA 


处 理 mmap 的 时 候 ， 普 通 文 件 或 共享 内 存 区 对 象 的 大 小 都 可 以 通过 
调用 ftruncate 修 改 。 


Sh 


#include <unistd.h> 
int ftruncate(int fd,off_t length); 
返回 : ERDIKO, AEA- 

Posix 就 该 函数 对 普通 文件 和 共享 内 存 区 对 象 的 处 理 的 定义 稍 有 不 
同 o 

对 于 一 个 普通 文件 : 如果 该 文件 的 大 小 大 于 length 参 数 ， 额 外 的 数 
据 束 被 丢弃 掉 。 如 果 该 文件 的 大 小 小 于 lengh， 那 么 该 文件 是 否 修改 以 
及 其 大 小 是 否 增长 是 未 加 说 明 的 。 实 际 上 对 于 一 个 普通 文件 ， 把 它 的 
大 小 扩展 到 length 字 市 的 可 移植 方法 症 : 先 lseek 到 偏 移 为 length-1 处 ， 
然后 write 1 个 字 节 的 数据 。 所 幸 的 是 几乎 所 有 Unix 实 现 都 文 持 使 用 
ftruncate 扩 展 一 个 文件 。 

对 于 一 个 共享 内 存 区 对 象 : ftruncate 把 该 对 象 的 大 小 设置 成 length 
srt e 

我 们 调用 ftruncate 来 指定 新 创建 的 共享 内 存 区 对 象 的 大 小 ， 或 者 修 
改 已 存在 的 对 象 的 大 小 。 当 打开 一 个 已 存在 的 共享 内 存 区 对 象 时 ， 我 
们 可 调用 fstat 来 获取 有 关 该 对 象 的 信息 。 
#include <sys/types.h> 
#include <sys/stat.h> 
int fstat(int fd,struct stat *buf); 

返回 : ERDIKO, AEA- 

stat 结 构 有 12 个 或 以 上 的 成 员 (APUE 第 4 章 详细 讨论 它 的 所 有 成 
， 然 而 当 fdq 指 代 一 个 共享 内 存 区 对 象 时 ， 只 有 四 个 成 员 舍 有 信息 。 


struct stat ( 


si 


mode t st mode; /* mode: S_I{RW}{USR,GRP,OTH} */ 
uid t st uid; /* user ID of owner */ 


gid t st gid; /* group ID of owner */ 


off t st size; /* size in bytes */ 


ie 


我 们 将 在 下 一 广 给 出 使 用 这 两 个 画 数 的 例子 。 

不 斑 的 是 ，Posix.1 并 没有 指 a tk 享 内 存 区 对 象 的 初始 
内 容 。 关 于 shm_open 函 数 的 说 明 只 说 : “ (新 创建 的 ) pedi 
的 大 小 应 该 为 0”。 关 于 ftruncate 函 数 的 说 明 指 定 ， 对 于 一 个 普通 文件 
m og “如 果 其 大 小 被 扩展 ， 那 么 扩展 部 分 e 得 好 像 
已 用 0 填写 过 *。 然 而 同样 在 关于 ftruncate 的 说 明 中 ， 却 没有 任何 有 关 被 
扩展 了 的 一 个 共享 内 存 区 对 象 新 内 容 的 陈述 。Posix.1 基 本 原理 声称 : 
“如 有 果 一 个 内 存 区 对 象 被 扩展 ， 那 么 扩展 部 分 内 容 全 为 0。 ”然而 这 只 是 
基本 原理 ， 而 不 是 正式 标准 。 当 作者 在 comp.std.unix 狐 闻 组 上 束 此 细 方 
提出 疑问 时 ， 得 到 的 观点 是 有 些 厂家 反对 初始 化 为 0 的 要 求 ， 因 为 这 么 
做 的 开销 很 大 。 如 果 一 个 新 扩展 的 共享 内 存 区 未 被 初始 化 为 菜 个 值 
(也 就 是 说 其 内 容 在 扩展 前 后 没有 改动 ) ， 那 么 有 可 能 成 为 一 个 安全 
漏洞 。 


13.4 简单 的 程序 


现在 开发 一 些 简 单 的 程序 来 操作 Posix 共 至 内 存 区 。 

13.4.1 shmcreate 程 序 

图 13-2 给 出 的 shmcreate 程 序 以 某 个 指定 的 名 字 和 长 度 创建 一 个 共享 
内 存 区 对 象 。 


pxshm/shmcreate.c 


1 #include "unpipc.h" 

2. dnt 

3 main(int argc, char **argv) 
4 1 

5 int c, fd, flags; 
6 char *ptr; 

7 off t length; 


8 flags - O RDWR | O CREAT; 


图 13-2 创建 一 个 具有 所 指定 大 小 的 Posix 共 享 内 存 区 对 象 


9 while ( (c = Getopt(argc, argv, "e")) != -1) { 

10 switch (c) ( 

11 case 'e': 

12 flags |- O EXCL; 

13 break; 

14 ) 

15 } 

16 if (optind != argc - 2) 

17 err quit("usage: shmcreate [ -e ] «name» <length>") ; 
18 length = atoi(argv[optind + 1]); 

19 fd - Shm open(argv[optind], flags, FILE MODE); 

20 Ftruncate(fd, length); 

21 ptr - Mmap(NULL, length, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
22 exit (0); 

23 } 


pxshm/shmcreate.c 


图 13-2 ( 续 ) 


19~22 shm_create 创 建 所 指定 的 共享 内 存 区 对 象 。 如 果 指 定 了 -e 选 
项 ， 那 么 奉 该 对 象 已 经 存在 则 将 出 错 。ftruncate 设 置 该 对 象 的 长 度 ， 
mmap 则 把 它 映 射 到 调用 进程 的 地 址 空间 。 

本 程序 随后 终止 。 既 然 Posix 共 享 内 存 区 至 少 具有 随 内 核 的 持续 
性 ， 因 此 本 程序 的 终止 不 会 删除 该 共享 内 存 区 对 象 。 

13.4.2 shmunlink 程 序 

图 13-3 给 出 的 简单 程序 只 是 调用 shm_unlink 从 系统 中 删除 一 个 共享 
内 存 区 对 象 的 名 字 。 


1 #include "unpipc.h" 


pxshm/shmunlink.c 


2 ant 
3 main(int argc, char **argv) 
4 { 
5 TE farge = 12) 
6 err quit ("usage: shmunlink <name>"); 
7 Shm_unlink (argv [1]) ; 
8 exit (0) ; 
9 } 
pxshm/shmunlink.c 
图 13-3 删除 一 个 共 台 内存 区 对 象 的 名 字 
13.4.3 shmwrite 程 序 


图 13-4 给 出 了 shmwrite 程 序 ， 它 往 一 个 共享 内 存 区 对 象 中 写 入 一 个 
模式 : 0，1，2，...，254，255，0，1，...。 

107-15 shmopen 打 开 所 指定 的 共享 内 存 区 对 象 ，fstat 获 取 其 大 小 信 
已 。 使 用 mmap 英 射 它 之 后 close 它 的 描述 符 。 

167-18 把 模式 写 入 该 共享 内 存 区 。 


pxshm/shmwrite.c 


1 #include "unpipc.h" 


2 ant 


3 main(int argc, char **argv) 


4 { 


5 int 1; fd; 
6 struct stat stat; 
7 unsigned char *ptr; 
8 if (argc !- 2) 
9 err quit("usage: shmwrite <name>") ; 
10 /* open, get size, map */ 
11 fd - Shm open(argv[1], O RDWR, FILE MODE); 
12 Fstat(fd, &stat); 
13 ptr - Mmap(NULL, stat.st size, PROT READ | PROT WRITE, 
14 MAP SHARED, fd, 0); 
15 Close (fd) ; 
16 /* sees perlo = 0, peria] = 1, ete. */ 
I for (i = 0; i < stat.st size; i++) 
18 *ptr++ = i $ 256; 
19 exit (0) ; 
20 } 
pxshm/shmwrite.c 
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图 13-4 打开 一 个 共 至 内 存 区 对 象 ， 填 写 一 个 数据 模式 


13.4.4 shmread 程 序 


13-5 给 出 的 shmread 程 序 验证 由 shmwrite 写 入 的 模式 。 


1 #include "unpipc.h" 


2 int 


3 main(int argc, char **argv) 


E: 


int 1, fd; 
struct stat stat; 
unsigned char c, *ptr; 


if (argc !- 2) 
err quit("usage: shmread <name>") ; 


/* open, get size, map */ 
fd - Shm open(argv[1], O RDONLY, FILE MODE); 
Fstat(fd, &stat); 
ptr - Mmap(NULL, stat.st size, PROT READ, 
MAP SHARED, fd, 0); 


Close(fd); 
/* check that ptr[0] = 0, ptr[1] = 1, etc. */ 
for (i = 0; i < stat.st size; i++) 
if ( (c = *ptr++) !- (i $ 256)) 
err ret("ptr[$d] = $d", i, c); 
exit (0); 


图 13-5 打开 一 个 共 译 内 存 区 对 象 ， 验 证 其 数据 模式 


pxshm/shmread.c 


pxshm/shmread.c 


10~15 打开 所 指定 的 共享 内 存 区 对 象 用 于 只 读 ， 使 用 fstat 获 取 其 大 
使 用 mmap 把 它 映 射 到 内 存 (用 于 只 读 目 的 ) ， 随 后 关闭 其 描 


小 信息 ， 


述 符 。 


167-19 验证 由 shmwrite 写 入 的 模式 。 

13.4.5 例子 

在 Digital Unix 4.0B 下 创建 一 个 长 度 为 123 456 字 市 、 名 
为 /tmp/myshm 的 共享 内 存 区 对 象 。 

alpha % shmcreate /tmp/myshm 123456 


alpha 96 ls -l /tmp/myshm 


-rw-r--r-- 1 rstevens system 123456 Dec 10 14:33 /tmp/myshm 


alpha 96 od -c /tmp/myshm 


0000000 X0 X0 XO NO NO VO NO NO NO NO NO NO NO NO NO VO 

0361100 

我 们 看 到 在 文件 系统 中 创建 了 一 个 同名 文件 。 使 用 od 程 序 可 验证 
该 对 象 的 初始 内 容 为 0。 〈 刚 刚 超过 该 文件 最 后 一 个 字 节 位置 的 八进制 
字 市 偏 移 0361100， 等 于 十 进 制 的 123 456 » ) 

接着 运行 我 们 的 shmwrite 程 序 ， 然 后 使 用 od 验证 初始 内 容 与 预期 的 
—1 e 

alpha 96 shmwrite /tmp/myshm 

alpha 96 od -x /tmp/myshm | head -4 

0000000 0100 0302 0504 0706 0908 Ob0a 0dOc Of0e 

0000020 1110 1312 1514 1716 1918 1b1a 1d1c 1f1e 

0000040 2120 2322 2524 2726 2928 2b2a 2d2c 2f2e 

0000060 3130 3332 3534 3736 3938 3b3a 3d3c 3f3e 

alpha 96 shmread /tmp/myshm 

alpha 96 shmunlink /tmp/myshm 

我 们 使 用 shmread 验 证 该 共享 内 存 区 对 象 的 内 容 后 删除 其 名 字 。 

如 果 在 Solaris 2.6 下 运行 我 们 的 shmcreate 程 序 ， 我 们 看 到 在 /tmp 目 
杂 下 创建 了 一 个 具有 所 指定 大 小 的 文件 。 

solaris 96 shmcreate —e /testshm 123 

solaris % ls -1/tmp /.*testshm* 

-rw-r—t-- 1 rstevens other1 123 Dec 10 14:40 /tmp/.SHMtestshm 

13.4.6 例子 

我 们 现在 在 图 13-6 中 提供 一 个 简单 的 例子 程序 ， 以 展示 同一 共享 内 
存 区 对 象 内 存 映 射 到 不 同 进程 的 地 址 空间 时 ， 起 始 地 址 可 以 不 一 样 。 

10~ 14 创建 一 个 其 名 字 为 命令 行 参数 的 共享 内 存 区 ， 把 它 的 大 小 
设置 为 一 个 整数 的 大 小 ， 然 后 打开 文件 /etc/motd 。 


15~30 fork 后 父子 进程 都 调用 mmap 两 次 ， 但 顺序 不 一 样 。 父 和子 进 
程 分 别 输 出 每 个 内 存 映射 区 的 起 始 地 址 。 子 进程 接着 睡眠 5 秒 ， 父 进程 
则 在 共享 内 存 区 中 写 入 值 777， 子 进程 醒 来 后 输出 该 值 。 

运行 这 个 程序 ， 我 们 发 现 所 指定 的 共享 内 存 区 对 象 在 父子 进程 中 
被 内 存 映 射 到 不 同 的 起 始 地 址 。 


solaris 96 test3 test3.data 


parent: shm ptr = eee30000,motd ptr = eee20000 

child: shm ptr = eee20000,motd ptr = eee30000 

shared memory integer = 777 

父 进程 把 值 777 存 入 0xeee30000 位 置 ， 子 进程 却 从 0xeee20000 位 置 
读 出 该 值 。 父 子 进 程 中 指针 ptrl 都 指向 同一 共享 内 存 区 ， 即 使 每 个 指针 
在 各 目 进 程 内 有 不 同 的 值 也 不 受 影响 。 


pxshm/test3.c 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 int fal; fd2, *ptrl, *ptr2; 

6 pid t childpid; 

7 struct stat stat; 

8 if (argc !- 2) 

9 err quit("usage: test3 <name>"); 

10 shm unlink(Px ipc name (argv[1])); 

ati fdl = Shm open(Px ipc name(argv[1]), O_RDWR | O CREAT | O EXCL, FILE MODE); 
12 Ftruncate(fd1l, sizeof(int)); 

13 fd2 - Open("/etc/motd", O RDONLY); 

14 Fstat(fd2, &stat); 

15 if ( (childpid = Fork()) == 0) ( 

16 /* child */ 

17 ptr2 = Mmap(NULL, stat.st size, PROT READ, MAP SHARED, fd2, 0); 
18 ptrl = Mmap(NULL, sizeof (int), PROT READ | PROT WRITE, 

19 MAP SHARED, fdl, 0); 
20 printf("child: shm ptr = $p, motd ptr = %p\n", ptrl, ptr2); 
21 sleep(5); 
22 printf ("shared memory integer = %d\n", *ptrl); 
23 exit (0); 
24 ) 
25 /* parent: mmap in reverse order from child */ 
26 ptrl = Mmap(NULL, sizeof(int), PROT READ | PROT WRITE, MAP SHARED, fdl, 0); 
27 ptr2 = Mmap(NULL, stat.st size, PROT READ, MAP SHARED, fd2, 0); 
28 printf("parent: shm ptr = %p, motd ptr = %p\n", ptrl, ptr2); 
29 *ptrl - 777; 
30 Waitpid(childpid, NULL, 0); 
31 exit (0); 
32 } 


pxshm/test3.c 


图 13-6 共享 内 存 区 在 不 同 进 程 中 可 以 出 现在 不 同 的 地 址 
13.5 给 一 个 共享 的 ;+ 续 加 1 


现在 开发 一 个 类 似 于 12.3 世 中 给 出 的 例子 ， 它 由 多 个 进程 给 存放 在 
共享 内 存 区 中 的 某 个 计数 器 持续 加 1。 我 们 把 该 计数 器 存放 在 一 个 共享 
内 存 区 中 ， 并 用 一 个 有 名 信和 号 量 来 同步 ， 不 过 不 再 需要 父子 进程 关系 
了 。 既然 Posix 共 享 内 存 区 对 象 科 Posix 有 名 信号 量 都 是 以 名 字 来 访问 
的 ， 因 此 将 给 共享 的 计数 句 持 续 加 1 的 各 个 进程 间 可 以 没有 杀 毕 关系 ， 


不 过 它们 都 得 知道 该 共享 内 存 区 和 该 信号 量 的 IPC 名 字 ， 并 有 访问 这 两 
个 IPC 对 象 的 足够 权限 。 

图 13-7 给 出 的 服务 器 程序 创建 所 指定 的 共享 内 存 区 对 象 ， 创 建 并 初 
始 化 所 指定 的 信号 量 ， 然 后 终止 。 

创建 共享 内 存 区 对 象 

13~19 我 们 调用 shm_unlink 以 提防 所 需 共享 内 存 区 对 象 已 经 存在 的 
情况 ， 然 后 调用 shm_open 创 建 该 对 象 。ftruncate 将 该 对 象 的 大 小 设置 成 
我 们 的 shmstruct 结 构 的 大 小 ， 该 对 象 本 喘 则 随后 由 mmap 映 射 到 调用 进 
程 的 地 址 宝 间 。 接 着 关闭 该 对 象 的 摘 述 符 。 


pxshm/server l.c 


1 #include "unpipc.h" 

2 struct shmstruct { /* struct stored in shared memory */ 
3 int count; 

4 } 

5 sem t *mutex; /* pointer to named semaphore */ 

6 int 


7 main(int argc, char **argv) 


9 int £d; 
10 struct shmstruct*ptr; 
Yi if (argc !- 3) 
12 err quit("usage: serverl <shmname> <semname>") ; 
13 shm unlink(Px ipc name (argv [1])); /* OK if this fails */ 
14 /* create shm, set its size, map it, close descriptor */ 
15 fd - Shm open(Px ipc name(argv[1]), O RDWR | O CREAT | O EXCL, FILE MODE); 
16 Ftruncate(fd, sizeof(struct shmstruct)); 
17 ptr - Mmap(NULL, sizeof(struct shmstruct), PROT READ | PROT WRITE, 
18 MAP SHARED, fd, 0); 
19 Close (fd); 
20 sem unlink(Px ipc name (argv[2]1)); /* OK if this fails */ 
21 mutex - Sem open(Px ipc name(argv[2]), O CREAT | O EXCL, FILE MODE, 1); 
22 Sem close (mutex) ; 
23 exit(0); 
24 } 


pxshm/server l.c 


图 13-7 创建 并 初始 化 共享 内 存 区 和 信和 号 量 的 程序 
创建 并 初始 化 信号 量 
20-22 我 们 调用 sem_unlink 以 提防 所 需 信和 号 量 已 经 存在 的 情况 ， 然 
后 调用 sem_open 创 建 该 有 名 信号 量 ， 并 把 它 初始 化 为 1。 将 给 存放 在 所 


创建 的 共享 内 存 区 对 象 中 的 计数 器 加 1 的 任何 进程 都 会 把 该 信号 量 用 作 
一 个 互 斥 锁 。 接 着 关闭 该 信号 量 。 

终止 

23 进程 终止 。 有 既然 Posix 共 享 内 存 区 至 少 具有 随 内 核 的 持续 性 ， 因 
此 所 创建 的 该 对 象 将 继续 存在 ， 直 到 它 的 所 有 打开 着 的 引用 都 天 闭 
( 当 本 进程 终止 时 ， 该 对 象 不 再 有 打开 着 的 引用 ) 并 且 该 对 象 被 显 式 
地 删除 为 止 。 

我 们 的 程序 必须 给 共享 内 存 区 和 信号 量 使 用 不 同 的 名 字 。 操作 系 
统 并 不 保证 给 IPC 名 字 加 上 点 什么 以 区 分 消息 队列 、 信 和 号 量 和 共 
[X » RIIE E Bl Solarist X = PRIPC A 78 BJ 4 F AP Al _E.MQ ` 
和 .SHM 的 前 级 ， 但 是 Digital Unix 却 没有 这 样 做 。 

图 13-8 给 出 了 我 们 的 客户 程序 ， 它 对 存放 在 共享 内 存 区 中 的 计数 器 
LN 定 次 数 的 加 1 操作 ， 每 次 给 该 计数 絮 加 1 时 都 事先 获取 你 护 它 的 
信号 


打开 共享 内 存 区 
157-18 shm_open 打 开 所 指定 的 共享 内 存 区 对 象 ， 该 对 象 必须 存在 
(因为 没有 指定 O_CREAT 标 志 ) d 到 调用 进 
程 的 地 址 空间 ， 然 后 关闭 它 的 描述 符 
打开 信号 量 
19 打开 所 指定 的 有 名 信号 


pxshm/clientl.c 


1 #include "unpipc.h" 

2 struct shmstruct { /* struct stored in shared memory */ 
3 int count; 

4}; 

5 sem t *mutex; /* pointer to named semaphore */ 

6 int 


7 main(int argc, char **argv) 


9 int fd, i, nloop; 

10 pidt pid; 

11 struct shmstruct*ptr; 

12 if (argc != 4) 

13 err quit("usage: client1 «shmname» «semname» <#loops>") ; 
14 nloop = atoi(argv[3]); 

15 fd = Shm_open(Px_ipc_name(argv[1]), O_RDWR, FILE MODE) ; 

16 ptr = Mmap(NULL, sizeof(struct shmstruct), PROT_READ | PROT_WRITE, 
17 MAP SHARED, fd, 0); 

18 Close (fd); 

19 mutex = Sem_open(Px_ipc_name(argv[2]), 0); 

20 pid = getpid(); 

21 for (i = 0; i < nloop; i++) { 

22 Sem wait (mutex) ; 

23 printf ("pid $1d: $dWMn", (long) pid, ptr->count++) ; 

24 Sem post (mutex) ; 

25 ) 

26 exit(0); 

27 ) 


pxshm/client1.c 


图 13-8 给 存放 在 共享 内 存 区 中 的 一 个 计数 器 加 1 的 程序 


获取 信和 号 量 并 给 计数 器 持续 加 1 

20~ 26 给 存放 在 所 打开 共享 内 存 区 中 的 计数 器 执行 由 命令 行 参数 
指定 次 数 的 加 1 操作 。 每 次 加 1 前 输出 该 计数 磺 原 来 的 值 以 及 当前 的 进 
程 ID， 输 出 进程 ID 是 因为 我 们 将 同时 运行 本 程序 的 多 个 副本 。 

我 们 首先 局 动 服务 器 ， 然 后 在 后 台 运 行 客 户 程序 的 三 个 副本 。 

solaris 96 serverl shm1 sem1 创建 并 初始 化 共享 内 存 区 
和 信和 号 量 

solaris 96 clienti shm1 sem1 10000 & clienti shm1 sem1 10000 & ^ 

client1 shm1 sem1 10000 & 


[2] 17976 由 shell 输 出 的 各 个 
进程 ID 


[3] 17977 

[4] 17978 

pid 17977: 0 进程 17977 首 先 运行 

pid 17977: 1 

T 进程 17977 继 续 运 行 

pid 17977: 32 

pid 17976: 33 内 核 切 换 上 下 文 到 进 
程 17976 

T 进程 17976 继 续 运 行 

pid 17976: 707 

pid 17978: 708 内 核 切换 上 下 文 到 进 
程 17978 

ae 进程 17978 继 续 运 行 

pid 17978: 852 

pid 17977: 853 内 核 切换 上 下 文 到 进 
程 17977 

T" 如 此 等 等 pid 17977: 
29998 

pid 17977: 29999 最 终 值 输出 ， 它 是 正 
确 的 


13.6 癌 一 个 服务 器 发 送 消息 


现在 对 我 们 的 生产 者 -消费 者 例子 作 如 下 修改 。 服 务 器 局 动 后 创建 
一 个 共享 内 存 区 对 象 ， 各 个 客户 进程 就 在 其 中 放置 消息 。 我 们 的 服务 
絮 只 是 输出 这 些 消 轧 ， 不 过 可 以 一 般 化 为 做 类 似 于 syslog 守 护 进程 所 做 


之 事 ， 该 守护 进程 在 UNPv1 第 13 章 中 讲述 。 我 们 把 其 他 进程 称 为 客 
户 ， 因 为 它们 相对 于 我 们 的 服务 夯 硅 现 为 客户 ， 但 是 它们 也 可 以 是 某 
种 处 理 其 他 客户 的 服务 器 。 举 例 来 说 ，Telnet 服 务 器 在 向 syslog 守 护 进 
程 发 送 登 记 请 县 时 束 是 后 着 的 一 个 客户 。 

我 们 没有 使 用 第 二 部 分 中 讲述 的 茶 种 消息 传递 技术 ， 而 是 使 用 共 
享 内 存 区 来 容纳 消息 当然， 这 使 得 我 们 有 必要 在 存 入 消息 的 各 个 客 
户 和 取 走 并 输出 消 妃 的 服务 着 之 间 采 取 某 种 形式 的 同步 。 岁 13-9 展 示 了 
总 体 设计 。 


| 含有 信号 量 和 消息 的 共享 内 存 区 | 


创建 并 初始 化 


取出 下 一 个 消息 并 输出 


服务 器 


图 13-9 多 个 客户 通过 共享 内 存 区 向 一 个 服务 器 发 送 消息 
这 儿 有 多 个 生产 者 CEP) 和 单个 消费 者 (服务 器 ) 。 共 享 内 存 
区 既 出 现在 服务 器 的 地 址 空间 ， 也 出 现在 各 个 客户 的 地 址 空间 。 
图 13-10 是 我 们 的 cliserv2.h 头 文件 ， 它 定义 了 一 个 给 出 共享 内 存 区 
对 和 象 布局 的 结构 。 


pxshm/cliserv2.h 


1 #include "unpipc.h" 

2 #define MESGSIZE 256 /* max #bytes per message, incl. null at end */ 
3 #define NMESG 16 /* max #messages */ 

4 struct shmstruct { /* struct stored in shared memory */ 

5 sem t mutex; /* three Posix memory-based semaphores */ 

6 sem t nempty; 

7 sem t nstored; 

8 int nput; /* index into msgoff[] for next put */ 

9 long noverflow; /* #overflows by senders */ 

10 sem t noverflowmutex; /* mutex for noverflow counter */ 

11 long msgof f [NMESG] ; /* offset in shared memory of each message */ 
12 char msgdata[NMESG * MESGSIZE] ; /* the actual messages */ 

13 } 


pxshm/cliserv2.h 


图 13-10 XE SUC VER CT FB SECURE 


基本 的 信号 量 和 变量 

5~8 mutex、nempty 和 nstored 这 三 个 Posix 基 于 内 存 的 信号 量 与 10.6 
广 里 生产 者 -消费 者 例子 中 的 同名 信号 量 作 用 相同 。 变 量 nput 是 用 于 存 
放 一 个 消息 的 下 一 个 位 置 的 下 标 (0、1、...、NMESG-1) 。 既 然 我 们 
有 多 个 生产 者 ， 该 变量 就 必须 存放 在 共享 内 存 区 中 ， 并 且 只 能 在 持 有 
mnutex 期 间 访问 。 

溢出 计数 器 

9~10 某 个 客户 想 发 送 一 个 消 妃 ， 但 是 所 有 的 消息 槽 位 都 被 占用 
了 ， 发 生 这 种 情况 的 可 能 性 是 存在 的 。 但 是 如 有 果 该 客户 实际 上 同时 又 
是 某 种 类 型 的 一 个 服务 器 ( 壁 如 说 是 一 个 FIP 服 务 器 或 HTTP 服 务 
器 ) ， 那 么 它 可 能 不 愿意 等 待 服务 器 释放 出 一 个 槽 位 。 因 此 ， 我 们 将 
把 客户 程序 编写 成 发 生 这 种 情况 时 并 不 阻塞 ， 而 是 给 noverflow 计 数 器 
加 1。 由 于 该 溢出 计数 器 也 是 在 所 有 客户 和 服务 器 之 间 共 享 的 ， 因 此 它 
也 需要 一 个 互 斥 锁 ， 以 免 其 值 遭 受 破坏 。 

消息 偏 移 和 数据 

117-12 数组 msgoff 含 有 针对 msgdata 数 组 的 各 个 偏 移 ， 指 出 了 每 个 
消息 的 起 始 位 置 。 这 就 是 说 ，msgoff[0] 为 0，msgofff1] 为 256 

(MESGSIZE 的 值 ) ，msgoff[2] 为 512， 等 等 。 


必须 搞 清楚 在 处 理 共享 内 存 区 时 ， 我 们 只 能 使 用 像 这 样子 的 偏 移 
(offset) ， 因 为 共享 内 存 区 对 象 可 映射 到 映射 它 的 各 个 进程 的 不 同 物 

理 地 址 。 也 就 是 说 ， 对 于 同一 个 共享 内 存 区 对 象 ， 调 用 mmap 的 每 个 进 
程 所 得 到 的 mmap 返 回 值 可 能 不 同 。 由 于 这 个 原因 ， 我 们 不 能 在 共享 内 
存 区 对 象 中 使 用 指针 (pointe) ， 因 为 它们 含有 存放 在 这 些 对 象 内 各 变 
量 的 实际 地 址 。 

图 13-11 是 我 们 的 服务 器 程序 ， 它 等 待 某 个 客户 往 所 指定 的 共享 内 
存 区 中 放置 一 个 消 轧 ， 然 后 输出 这 个 消息 。 

创建 共享 内 存 区 对 象 

107-16 首先 调用 shm_unlink 删 除 可 能 仍然 存在 的 共享 内 存 区 对 象 。 
接着 使 用 shm_open 创 建 这 个 对 象 ， 再 使 用 mmap 把 它 上 映射 到 调用 进程 的 
地 址 空间 。 然 后 天 闭 它 的 描述 符 。 

初始 化 偏 移 量 数组 

17~19 把 偏 移 量 数组 msgoff 初 始 化 为 含有 每 个 消息 的 位 置 偏 移 。 

初始 化 信和 号 量 

207-24 初始 化 存放 在 共享 内 存 区 对 象 中 的 四 个 基于 内 存 的 信号 
量 。 每 个 sem_init 调 用 的 第 二 个 参数 都 不 为 0， 因 为 这 些 信号 量 将 在 进程 
间 共 享 。 

等 待 消息 ， 然 后 输出 

25-36 for 循 环 的 前 半 部 分 是 标准 的 消费 者 算法 : 等待 nstored 变 为 
大 于 0， 等 待 mutex， 处 理 数据 ， 释 放 mutex， 然 后 给 nempty 加 1 。 

处 理 溢出 

37--43 每 次 经 由 这 个 循环 ， 我 们 还 检查 是 否 溢出 。 我 们 测试 计数 
希 noverflows 的 值 是 否 不 同 于 上 一 次 的 什 ， 者 是 则 输出 并 保存 这 个 新 
值 。 注 意 ， 我 们 是 在 持 有 noverflowmutex 信 号 量 期 间 获 取 该 计数 器 的 值 
的 ， 但 在 比较 并 输出 它 之 前 先 释 放 了 这 个 信号 量 。 这 么 一 来 展示 了 如 


下 的 一 般 规则 :我 们 应 该 把 持 有 某 个 互 斥 锁 期 间 执行 的 代码 编写 得 操 
作 总 数 尽量 地 少 。 


pxshm/server2.c 


1 #include "cliserv2.h" 
2 int 
3 main(int argc, char **argv) 
& 4 
5 int fd, index, lastnoverflow, temp; 
6 long offset; 
7 struct shmstruct*ptr; 
8 if (arge l= 2) 
9 err quit("usage: server2 <name>") ; 
10 /* create shm, set its size, map it, close descriptor */ 
TT shm unlink(Px ipc name (argv[11)); /* OK if this fails */ 
12 fd - Shm open(Px ipc name(argv[1]), O RDWR | O CREAT | O EXCL, FILE MODE); 
13 ptr - Mmap(NULL, sizeof(struct shmstruct), PROT READ | PROT WRITE, 
14 MAP SHARED, fd, 0); 
15 Ftruncate(fd, sizeof(struct shmstruct)); 
16 Close (fd) ; 
17 /* initialize the array of offsets */ 
18 for (index = 0; index < NMESG; index++) 
19 ptr-»msgoff[index] - index * MESGSIZE; 
20 /* initialize the semaphores in shared memory */ 
21 Sem init(&ptr-»mutex, 1, 1); 
22 Sem init(&ptr-»nempty, 1, NMESG); 
23 Sem init(&ptr-»nstored, 1, 0); 
24 Sem init(&ptr-»noverflowmutex, 1, 1); 
25 /* this program is the consumer */ 
26 index - 0; 
27 lastnoverflow - 0; 
28 for ($31 
29 Sem wait (&ptr-»nstored); 
30 Sem wait (&ptr->mutex) ; 
31 offset - ptr-»msgoff [index]; 
32 printf ("index = $d: %s\n", index, &ptr->msgdata [offset]); 
33 if (++index »- NMESG) 
34 index - 0; /* circular buffer */ 
35 Sem post (&ptr-»mutex); 
36 Sem post (&ptr->nempty) ; 
37 Sem wait (&ptr->noverflowmutex) ; 
38 temp - ptr-»noverflow; /* don't printf while mutex held */ 
39 Sem post (&ptr->noverflowmutex) ; 
40 if (temp !- lastnoverflow) ( 
41 printf("noverflow = %d\n", temp); 
42 lastnoverflow - temp; 
43 ) 
44 ) 
45 exit(0); 
46 ) 


pxshm/server2.c 


图 13-11 从 共享 内 存 区 中 取得 并 输出 消息 的 服务 器 程序 


图 13-12 给 出 了 我 们 的 客户 程序 。 


pxshm/client2.c 


1 #include "cliserv2.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 int fd, i, nloop, nusec; 

6 pid t pid; 

7 char mesg [MESGSIZE] ; 

8 long offset; 

9 struct shmstruct*ptr; 
10 if (argc != 4) 

11 err quit ("usage: client2 «name» <#loops> <#usec>") ; 
12 nloop = atoi(argv[2]); 

13 nusec = atoi (argv[3]); 

14 /* open and map shared memory that server must create */ 
15 fd - Shm open(Px ipc name(argv[1]), O RDWR, FILE MODE); 
16 ptr - Mmap(NULL, sizeof(struct shmstruct), PROT READ | PROT WRITE, 
17 MAP SHARED, fd, 0); 

18 Close (fd); 

19 pid = getpid(); 
20 for (i = 0; i < nloop; i++) { 
21 Sleep us (nusec) ; 
22 snprintf (mesg, MESGSIZE, "pid %ld: message %d", (long) pid, i); 
23 if (sem_trywait (&ptr->nempty) == -1) { 
24 if (errno == EAGAIN) { 
25 Sem_wait (&ptr->noverflowmutex) ; 
26 ptr->noverflow++; 
27 Sem post (&ptr->noverflowmutex) ; 
28 continue; 
29 } eise 
30 err sys("sem trywait error"); 

31 } 

32 Sem_wait (&ptr->mutex) ; 

33 offset = ptr->msgoff [ptr->nput] ; 

34 if (++(ptr->nput) >= NMESG) 

35 ptr->nput = 0; /* circular buffer */ 

36 Sem_post (&ptr->mutex) ; 

37 strcpy(&ptr-»msgdata [offset], mesg) ; 

38 Sem post (&ptr->nstored) ; 

39 } 
40 exit (0); 
41 ) 


pxshm/client2.c 


图 13-12 在 共享 内 存 区 中 给 服务 器 存放 消 ， 
命令 行 参 数 
107-13 第 一 个 命令 行 


ARS ae FF AE ABN, Be 


时 的 客户 程序 


数 是 共享 内 存 区 对 象 的 名 字 ， 下 一 个 是 给 
个 是 每 次 存放 消息 之 间 停 顿 的 微 秒 数 。 


"m 


Hn 


通过 启动 本 客户 程序 的 多 个 副本 并 指定 一 个 较 小 的 停顿 值 ， 我 们 可 以 
强行 造成 港 出， 然后 验证 服务 器 能 正确 地 处 理 它 。 

打开 并 映射 共享 内 存 区 

14~18 在 假设 所 指定 的 共享 内 存 区 对 象 已 经 存在 的 前 提 下 ， 我 们 
打开 该 对 象 ， 然 后 把 它 映射 到 当前 进程 的 地 址 空间 。 随 后 关闭 它 的 朱 
UTE e 

存放 消息 

19~31 客户 程序 接着 依循 基本 的 生产 者 算法 工作 ， 不 过 我 们 把 组 
冲 区 中 没有 存放 新 消息 的 空间 时 生产 者 阻塞 在 其 中 的 sem_wait(nempty) 
调用 换 成 了 不 会 阻塞 的 sem_trywait 调 用 。 如 果 nempty 信 号 量 的 值 为 0， 
TA ERO [8] — EAGAINSTSE: o RA Her] E ARA 268 Vi Ha YT Cn UI 
1 o 


sleep_us 是 来 自 APUE 图 C.9 和 图 C.10 的 一 个 函数 。 它 睡眠 指定 数目 
的 微 秒 数 ， 是 通过 调用 select 和 poll 来 实现 的 。 

32-37 我 们 在 持 有 mutex 信 和 号 量 期 间 取 得 offset 的 值 并 给 nput 加 1， 
但 在 接 下 去 把 新 消息 复制 到 共享 内 存 区 之 前 却 释 放 了 mutex。 在 持 有 该 
信号 量 期 间 ， 我 们 只 应 该 执行 那些 必须 被 保护 起 来 的 操作 。 

我 们 首先 在 后 台 局 动 服 务 器 ， 然 后 运行 一 个 客户 ， 给 它 指定 50 个 
待 存放 消息 ， 每 个 消息 的 存放 没有 彼此 间 的 停顿 。 

solaris 96 server2 serv2 & 

[2] 27223 


solaris 96 client2 serv2 50 0 


index = 0: pid 27224: message 0 

index = 1: pid 27224: message 1 

index = 2: pid 27224: message 2 

TT 如 此 继续 index = 15: 
pid 27224: message 47 


index = 0: pid 27224: message 48 
index = 1: pid 27224: message 49 没有 消息 丢失 
但 是 当 我 们 再 次 运行 一 个 客户 时 ， 却 看 到 了 一 些 溢出 现象 : 


solaris 96 client2 serv2 50 0 


index = 2: pid 27228: message 0 

index = 3: pid 27228: message 1 

ae 仍然 正常 index = 10: 
pid 27228: message 8 

index = 11: pid 27228: message 9 

noverflow = 25 服务 器 检测 到 有 25 个 
消息 丢失 index = 12: pid 27228: message 10 

index = 13: pid 27228: message 11 
ya 消息 12 一 22 仍 然 正常 
index = 9: pid 27228: message 23 

index = 10: pid 27228: message 24 

x — UAE P BU ER TF 1850-9, EMEA OS ae DOE OT TU 
出 。 该 客户 继续 和 运行， 准备 存放 消息 10 一 49， 但 是 共享 内 存 区 中 只 有 
存放 其 中 前 15 个 消息 的 空间 ， 于 是 剩余 的 25 个 消息 编号 为 25 一 49) 
Es EH TU ZR BER DAC 。 

很 明显 ， 在 本 例子 中 通过 让 客户 尽 可 能 快 地 产生 消 轧 ， 而 且 每 次 
存放 消息 之 间 没 有 停顿 来 达到 溢出 效果 ， 不 过 这 并 不 是 一 种 典型 的 现 
实情 形 。 然 而 本 例子 的 目的 只 是 展示 客户 产生 的 消息 没有 存放 空间 可 
用 ， 但 是 客户 又 不 想 为 此 而 阻塞 的 情况 应 如 何 处 理 。 这 种 情况 并 不 是 
只 有 共享 内 存 区 才 有 的 ， 消 息 队 列 、 管 道 和 FIFO 都 可 能 发 生 同 样 情 
ES 

A Te DEAE. X8 CRE CIE AN at EB TROE 2E AE RAR BUT. Hi 
EH © UNPv1838.13 P M UDP E RUDE Ber MR HX DTT T TAYE 


情形 。TCPv3 的 18.2 广 讲述 了 接收 者 的 缓冲 区 发 生 淤 出 时 ，Unix 域 数据 
报 套 接 字 是 如 何 向 发 送 者 返回 一 个 ENOBUFS 错 误 的 。 在 图 13-12 中 ， 我 
们 的 客户 (发 送 者 ) 知道 什么 时 候 服 务 器 的 缓冲 区 洲 出 了 ， 因 此 要 是 
把 这 段 代 码 放 到 某 个 供 其 

他 程序 调用 的 通用 函数 中 ， 那 么 当 服务 器 的 缓冲 区 淤 出 时 ， 该 函 
数 有 可 能 向 调用 者 返回 一 个 错误 。 


13.7 小 结 


Posix 共 享 内 存 区 构筑 在 上 一 章 讲述 的 mmap 本 数 之 上。 我 们 首先 指 
定 待 打开 共享 内 存 区 的 Posix IPC 名 字 来 调用 shm_open， 取 得 一 个 描述 
从 后 使 用 mmap 把 它 映 射 到 内 存 。 其 结 采 类 似 于 内 存 映 射 文件 ， 不 过 共 
2 i \ 作 为 一 个 文件 来 实现 。 

既然 共享 内 存 区 对 象 是 由 描述 符 来 表示 的 ， 它 们 的 大 小 就 使 用 
ftruncate 来 设置 ， 有 关 某 个 已 存在 对 象 的 信息 ( 保 扩 位、 用户 ID、 组 ID 
及 大 小 ) 由 fstat 返 回 。 

在 讨论 Posix 消 恩 队 列 和 Posix 信 号 量 时 ， 我 们 分 别 在 5.8 广 和 10.15 字 
提供 了 它们 基于 内 存 映 射 TO 的 实现 。 我 们 不 对 Posix 共 享 内 存 区 提供 这 
样 的 实现 ， 因 为 实在 太 简 单 。 如 宁愿 意 以 内 存 映 射 一 个 文件 的 方式 
(这 在 Solaris 和 Digital Unix 上 都 有 实现 ) 来 实现 Posix 共 享 内 存 区 这 种 
IPC 形 式 ， 那 么 shm_open 是 通过 调用 open 实 现 的 ，shm_unlink 是 通过 调 
用 unlink 实 现 的 。 


习题 


13.1 把 图 12-16 和 图 12-19 修 改 成 访问 Posix 共 享 内 存 区 而 不 是 内 存 映 
射 文件 ， 并 验证 它们 的 运行 结果 与 原来 访问 内 存 映 射 文件 的 程序 相 
同 o 


13.2 在 图 13-4 和 图 13-5 的 for 循 环 中 ， 用 于 步 进 访问 数组 元 素 的 C 表 
达 式 为 *ptr++。 改 用 ptr[ 订 更 为 可 取 吗 ? 


第 14 章 System V 共 享 内 存 区 


14.1 概述 


System V 共 享 内 存 区 在 概念 上 类 似 于 Posix 共 享 内 存 区 。 代 之 以 调 
用 shm_open 后 调用 mmap 的 是 ， 先 调用 shmget， 再 调用 shmat ° 

对 于 每 个 共享 内 存 区 ， 内 核 维护 如 下 的 信息 结构 ， 它 定义 在 
<Sys/shm.h> 头 文件 中 : 


struct shmid ds { 


struct ipc perm shm perm; /* operation permission struct */ 
size t shm, segsz; /* segment size */ 

pid t shm lpid; /* pid of last operation */ 

pid t shm cpid; /* creator pid */ 

shmatt t shm nattch;  /* current # attached */ 

shmat t shm cnattch; /* in-core # attached */ 

time t shm atime; /* last attach time */ 

time t shm dtime; /* last detach time */ 

time t shm ctime; /* last change time of this 


structure */ 
}; 
我 们 已 在 3.3 节 描述 过 其 中 的 ipc_perm 结 构 ， 它 舍 有 本 共享 内 存 区 
的 访问 权限 。 


14.2 shmget 国 数 


shmget 函 数 创建 一 个 新 的 共享 内 存 区 ， 或 者 访问 一 个 已 存在 的 共享 
内 存 区 。 

#include <sys/shm.h> 

int shmget(key t key,size t size,int oflag); 

返回 : ERE AETEPEDONER. AENA 
-1 
返回 值 是 一 个 称 为 共享 内 存 区 标识 符 (shared memory identifier) 

的 整数 ， 其 他 三 个 shmXXX 画 数 就 用 它 来 指 代 这 个 内 存 区 。 

key 既 可 以 是 ftok 的 返回 值 ， 也 可 以 是 IPC_PRIVATE ， 我 们 已 在 3.2 
万 讨论 过 

Size 以 字 节 为 单位 指定 内 存 区 的 大 小 。 当 实际 操作 为 创建 一 个 新 的 
共享 内 存 区 时 ， 必 须 指定 一 个 不 为 0 的 size 值 。 如 果实 际 操作 为 访问 一 
个 已 存在 的 共享 内 存 区 ， 那 么 size 应 为 0。 

oflag 是 图 3-6 中 所 示 读 写 权 限 值 的 组 合 。 它 还 可 以 与 IPC_CREAT 或 
IPC_CREAT | IPC_EXCL 按 位 或 ， 如 随 图 3-4 所 作 的 讨论 。 

当 实 际 操作 为 创建 一 个 新 的 共享 内 存 区 时 ， 该 内 存 区 被 初始 化 为 
size^f THO » 

注意 ， Simge Re s T7T 8 LS AEX, (AFAR A 28 val ERE E 
供 访 问 该 内 存 区 的 手段 。 这 是 shmat 范 数 的 目的 ， 我 们 将 接 下 去 讲述 


mr 


已 o 


14.3 shmat HAL 


由 shmget 创 建 或 打开 一 个 共 至 内 存 区 后 ， 通 过 调用 shmat 把 它 附 接 
到 调用 进程 的 地 址 空间 。 


#include <sys/shm.h> 


void *shmat(int shmid,const void *shmaddr,int flag); 
返回 : 者 成 功 则 为 映射 区 的 起 始 地 址 ， 大 出错 则 
| 

其 中 shmid 是 由 shmget 返 回 的 标识 从 。shmat 的 返回 值 是 所 指定 的 共 
享 内 存 区 在 调用 进程 内 的 起 始 地 址 。 确 定 这 个 地 址 的 规则 如 下 。 

如 有 果 shmaddr 是 一 个 空 指针 ， 那 么 系统 蔡 调 用 者 选择 地 址 。 这 是 推 
荐 的 (也 是 可 移植 性 最 好 的 ) 方法 。 

如 果 shmaddr 一 是 一 个 非 空 指针 ， 那 么 返回 地 址 取决 于 调用 者 古 否 
给 flag 参 数 指定 了 SHM_RND 值 : 

如 条 没 有 指定 SHM_RND ， 那 么 相应 的 共享 内 存 区 附 接 到 由 
shmaddr 参 数 指 定 的 地 址 ， 如 果 指 定 了 SHM_RND， 那 么 相应 的 共享 内 
存 区 附 接 到 由 shmaddr 参 数 指定 的 地 址 向 下 舍 入 一 个 SHMLBA 常 值 。 
LBA 代 表 “ 低 端 边界 地 址 (lower boundary address) ”。 

默认 情况 下 ， 只 要 调用 进程 具有 某 个 共享 内 存 区 的 读 写 权 限 ， 它 
附 接 该 内 存 区 后 就 能 够 同时 读 写 该 内 存 区 。flag 参 数 中 也 可 以 指定 
SHM_RDONLY 值 ， 它 限定 只 读 访问 。 


14.4 shmdt 范 数 


当 一 个 进程 完成 某 个 共享 内 存 区 的 使 用 时 ， 它 可 调用 shmdt 断 接 这 
个 内 存 区 。 


#include <sys/shm.h> 


int shmdt(const void *shmaddr); 
返回 : BAMA, EAA- 
当 一 个 进程 终止 时 ， 它 当前 附 接着 的 所 有 共享 内 存 区 都 目 动 断 接 
f o 
1 ek AS ES BOVE A AAR EREN F o AXAR LFA 
X LPC_RMD RS YH shmt Zk, RIKE T-TREE ° 


14.5 shmctl ERR 


shmect 提 供 了 对 一 个 共享 内 存 区 的 多 种 操作 。 


#include <sys/shm.h> 


int shmctl(int shmid,int cmd,struct shmid_ds *buff); 
该 函数 提供 了 三 个 命令 。 
返回 : ERDIKO, ABENA- 

IPC_RMID 从 系统 中 删除 由 shmid 标 识 的 共享 内 存 区 并 拆除 它 。 [3] 
IPC_SE. 给 所 指定 的 共享 内 存 区 设置 其 shmid_ds 结 构 的 以 下 三 个 成 
shm_perm.uid、shm_perm.gid 和 shm_perm.mode， 它 们 的 值 来 自 buff 
参数 指向 的 结构 中 的 相应 成 员 。shm_ctime 的 值 也 用 当前 时 间 震 换 。 

IPC_STAT (通过 buff 参 数 ) 向 调用 者 返回 所 指定 共享 内 存 区 当前 
的 shmid_ds 结 构 。 


学 uu 


14.6 简单 的 程序 
我 们 现在 开发 一 些 对 System V 共 享 内 存 区 进行 操作 的 简单 程序 。 


14.6.1 shmget 程 序 

14-1 给 出 的 shmget 程 序 使 用 指定 的 路 径 名 和 长 度 创建 一 个 共 至 内 
存 区 。19 shmget 创 建 由 用 户 指 定 其 名 字 和 大 小 的 共享 内 存 区 。 作 为 命 
令 行 参数 传递 进来 的 路 径 名 由 ftok 映 射 成 一 个 System V IPC 键 。 如 果 指 
定 了 -e 选 项 ， 那 么 一 旦 该 内 存 区 已 存在 束 会 出 错 。 如 果 我 们 知道 该 内 存 
区 已 存在 ， 那 么 在 命令 行 上 的 长 度 参 数 必须 指定 为 0。20 shmat 把 该 内 
存 区 附 接 到 当前 进程 的 地 址 空间 。 本 程序 然后 终止 ， 不 过 既然 System V 
共享 内 存 区 至 少 具 有 随 内 核 的 持续 性 ， 那 么 这 不 会 删除 该 共享 内 存 
区 。 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 ( 

5 int c, id, oflag; 

6 char *ptr; 

7 size t length; 

8 oflag - SVSHM MODE | IPC CREAT; 

9 while ( (c = Getopt(argc, argv, "e")) !- -1) ( 
10 switch (c) ( 

11 case 'e': 

12 oflag |= IPC EXCL; 

13 break; 

14 ) 

15 ) 

16 if (optind !- argc - 2) 

17 err quit("usage: shmget [ -e ] «pathname» «length»"); 
18 length = atoi(argv[optind + 1]); 

19 id - Shmget(Ftok(argv[optind], 0), length, oflag); 
20 ptr - Shmat(id, NULL, 0); 

21 exit (0); 

22 } 


svshm/shmget.c 


图 14-1 创建 一 个 指定 大 小 的 System V 共 享 内 存 区 
14.6.2 shmrmid 程 序 


svshm/shmget.c 


图 14-2 给 出 的 简单 程序 只 是 以 一 个 IPC_RMID 命 令 调 用 shmctl， 以 


便 从 系统 中 删除 一 个 共享 内 存 区 。 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 { 

5 int id; 

6 if (argc != 2) 

7 err quit("usage: shmrmid <pathname>") ; 
8 id = Shmget (Ftok(argv[1], 0), 0, SVSHM_MODE) ; 
9 Shmct1 (id, IPC_RMID, NULL) ; 

10 exit (0); 

11 } 


x<] 


图 14-2 删除 一 个 System V 共 享 内 存 


14.6.3 shmwrite 程 序 


svshm/shmrmid.c 


svshm/shmrmid.c 


图 14-3 给 出 了 shmwrite 程 序 ， 它 往 一 个 共享 内 存 区 中 写 入 一 个 模 
1 


svshm/shmwrite.c 


1 #include "unpipc.h" 


2 int 

3 main(int argc, char **argv) 
5 int i; id; 

6 struct shmid ds buff; 
7 


unsigned char *ptr; 


8 if (argc != 2) 
err quit("usage: shmwrite «pathname»"); 


10 id - Shmget(Ftok(argv[1], 0), 0, SVSHM MODE); 
rI ptr = Shmat (id, NULL, 0); 

12 Shmctl(id, IPC STAT, &buff); 

13 /* set: ptr[0] = 0, ptr[1] » 1, etc. */ 
14 for (i = 0; i « buff.shm segsz; i++) 

15 *ptr++ = i $ 256; 

16 exit (0); 

47 3 


~ 
cj 


svshm/shmwrite.c 


图 14-3 打开 一 个 共享 内 存 区 ， 填 入 一 个 数据 模式 
107-12 使 用 shmget 打 开 所 指定 的 共享 内 存 区 后 由 shmat 把 它 附 接 到 


前 进程 的 地 址 空间 。 其 大 小 通过 以 一 个 IPC_STAT 命 令 调用 shmctl 取 


13-15 往 该 共享 内 存 区 中 写 入 给 定 的 模式 。 
14.6.4 shmread 程 序 
图 14-4 给 出 的 shmread 程 序 会 验证 由 shmwrite 写 入 的 模式 。 


svshm/shmread.c 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 ( 

5 int T4, Xd 

6 struct shmid ds buff; 

y unsigned char Q, *ptn; 

8 if (arge I= 2) 

9 err quit("usage: shmread <pathname>") ; 

10 id - Shmget(Ftok(argv[1], 0), 0, SVSHM MODE); 
T1 ptr = Shmat (id, NULL, 0); 

{2 Shmctl(id, IPC STAT, &buff); 

13 /* check that ptr[0] = 0, ptr[1] = 1, etc. */ 
14 for (i = 0; i « buff.shm segsz; i++) 

15 if ( (c = *ptr++) != (i $ 256)) 

16 err ret ("ptr[td] = $d"; i, c); 

17 exit(0); 

18 ) 


svshm/shmread.c 


图 14-4 打开 一 个 共享 内 存 区 ， 验 证 其 数据 模式 

10~ 12 打开 并 附 接 所 指定 的 共享 内 存 区 。 其 大 小 通过 以 一 个 
IPC STAT A <i] H shme jH » 137-16 验证 由 shmwrite 写 入 的 模式 。 

14.6.5 例子 

在 Solaris 2.6 下 创建 一 个 大 小 为 1234 字 节 的 共享 内 存 区 。 用 于 标识 
该 内 存 区 的 路 径 名 (也 就 是 传递 给 ftok 的 路 径 名 ) 是 我 们 的 shmget 可 执 
行文 件 的 路 径 名 。 对 于 一 个 给 定 的 应 用 ， 使 用 服务 器 的 可 执行 文件 路 
径 名 往往 能 够 提供 一 个 唯一 的 标识 符 。 

solaris 96 shmget shmget 1234 


solaris 96 ipcs -bmo 


IPC status from «running system» as of Thu Jan 8 13:17:06 1998 


T ID KEY MODE OWNER 
GROUP NATTCH SEGSZ 
m 1  0x0000f12a --rw-r--r-- rstevens — other1 0 


1234 Shared Memory: 


我 们 运行 ipcs 程 序 以 验证 相应 的 共享 内 存 区 已 经 创建 出 来 。 注 意 它 
的 附 接 数 〈 存 放 在 该 内 存 区 的 shmid_ds 结 构 的 shm_nattch 成 员 中 ) 730, 
跟 我 们 预期 的 一 致 。 

接着 运行 我 们 的 shmwrite 程 序 ， 以 把 该 共享 内 存 区 的 内 容 设置 成 给 
定 的 模式 。 然 后 用 shmread 验 证 该 共享 内 存 区 的 内 容 ， 并 删除 其 标识 
从 。 

solaris % shmwrite shmget 

solaris % shmread shmget 

solaris % shmrmid shmget 

solaris 96 ipcs -bmo 


IPC status from «running system» as of Thu Jan 8 13:17:06 1998 


T ID KEY MODE OWNER 
GROUP NATTCH SEGSZ 
Shared Memory: 


我 们 运行 ipcs 来 验证 该 共享 内 存 区 确实 已 被 删除 。 

当 把 服务 器 可 执行 文件 的 名 字 用 作 ftok 的 参数 来 标识 菜 种 形式 的 
System V IPC 时 ， 通 常 应 使 用 绝对 路 径 名 (例如 /usr/bin/myserverd) , 
而 不 是 像 本 例子 那样 使 用 一 个 相对 路 径 名 (shmget) 。 我 们 能 在 本 市 的 
例子 中 使 用 相对 路 径 名 的 原因 是 ， 所 有 程序 都 是 从 含有 服务 器 可 执行 
文件 的 目录 中 运行 的 。 我 们 知道 ftok 使 用 文件 的 索引 节点 来 构成 IPC 标 
WATS 〈 见 图 3-2) ， 而 一 个 给 定 文件 是 使 用 一 个 绝对 路 径 名 还 是 一 个 相 
对 路 径 名 来 引用 对 于 其 索引 万 点 并 没有 影响 。 


14.7 X 


跟 System V 消 息 队 列 和 System V 信 号 量 一 样 ，System V 共 享 内 存 区 
也 存在 特定 的 系统 限制 (3.85) 。 图 14-5 给 出 了 本 书 所 用 两 种 不 同 实 


现 的 这 些 限 制 值 。 其 中 第 一 栏 是 含有 当前 限制 值 的 内 核 变量 的 传统 
System VÆ F ° 


Soe eee = 4 194 304 1 048 576 


114-5 System V 共 至 内 存 区 的 典型 系统 限制 


例子 
图 14-6 中 的 程序 可 确定 图 14-5 中 给 出 的 四 个 限制 值 。 


svshm/limits.c 


1 #include "unpipc.h" 

2 #define MAX NIDS 4096 

3 int 

4 main(int argc, char **argv) 

5 { 

6 int i, j, shmid[MAX NIDS]; 

7 void *addr[MAX NIDS]; 

8 unsigned long size; 

9 /* see how many identifiers we can "open" */ 

10 for (i = 0; i <= MAX NIDS; i++) { 

11 shmid[i] = shmget(IPC PRIVATE, 1024, SVSHM MODE | IPC CREAT) ; 
12 if (shmid[i] == -1) { 

13 printf("$d identifiers open at once\n", i); 
14 break; 

15 } 

16 } 

17 for (J = 0; J < i; j++) 

18 Shmctl(shmid[j], IPC RMID, NULL); 

19 /* now see how many we can "attach" */ 

20 for (i = 0; i <= MAX NIDS; i++) { 


ot 
à 


图 14-6 确定 共享 内 存 区 的 系统 限制 


21 shmid[i] = Shmget(IPC PRIVATE, 1024, SVSHM MODE | IPC CREAT); 


22 addr[i] = shmat(shmid[i], NULL, 0); 

23 if (addr[i] == (void *) -1) ( 

24 printf("$d shared memory segments attached at once\n", i); 
25 Shmctl(shmid[i], IPC RMID, NULL); /* the one that failed */ 
26 break; 

27 ) 

28 } 

29 for (j = 0; j «i; j++) { 

30 Shmdt (addr [j]) ; 

31 Shmctl(shmid[j], IPC RMID, NULL); 

32 ) 

33 /* see how small a shared memory segment we can create */ 

34 for (size = 1; ; size++) { 

35 shmid[0] - shmget (IPC PRIVATE, size, SVSHM MODE | IPC CREAT); 
36 if (shmid[0] != -1) { /* stop on first success */ 

37 printf ("minimum size of shared memory segment = %lu\n", size); 
38 Shmctl(shmid[0], IPC RMID, NULL); 

39 break; 

40 ) 

41 } 

42 /* see how large a shared memory segment we can create */ 

43 for (size = 65536; ; size += 4096) { 

44 shmid[0] = shmget(IPC PRIVATE, size, SVSHM MODE | IPC CREAT); 
45 if (shmid[0] == -1) ( /* stop on first failure */ 

46 printf("maximum size of shared memory segment = %lu\n", size-4096); 
47 break; 

48 } 

49 Shmctl(shmid[0], IPC RMID, NULL); 

50 ) 

51 exit(0); 

52 } 


svshm/limits.c 


图 14-6 (4) 

在 Digital Unix 4.0B 下 运行 这 个 程序 的 结果 为 : 

alpha 96 limits 

127 identifiers open at once 

32 shared memory segments attached at once 

minimum size of shared memory segment - 1 

maximum size of shared memory segment = 4194304 

图 14-5 指 出 128 个 标识 符 的 限制 ， 但 我 们 的 程序 只 能 创建 127 个 ， 其 
原因 在 于 有 一 个 系统 守护 进程 早已 创建 了 一 个 共享 内 存 区 。 


14.8 小 结 


System V 共 享 内 存 区 在 概念 上 与 Posix 共 享 内 存 区 类 似 。 最 常用 的 
函数 调用 有 以 下 几 个 。 

shmget: 获取 一 个 标识 符 。 

shmat: 把 一 个 共享 内 存 区 附 接 到 调用 进程 的 地 址 空间 。 

以 一 个 IPC_STAT 命 令 调用 shmctl 获取 一 个 已 存在 共享 内 存 区 的 
大 小 。 

以 一 个 IPC_RMID 命 令 调用 shmctl 删除 一 个 共享 内 存 区 对 象 。 

两 者 的 差别 之 一 是 ，Posix 共 享 内 存 区 对 象 的 大 小 可 在 任何 时 刻 通 
过 调用 ftruncate 修 改 “如 习题 13.1 中 所 展示 的 那样 ) ， 而 System V 共 享 
内 存 区 对 象 的 大 小 是 在 调用 shmget 创 建 时 固定 下 来 的 。 


习题 
14.1 图 6-8 是 对 图 6-6 的 修改 ， 它 接受 的 用 于 指定 队列 的 是 标识 符 而 
不 是 路 径 名 。 我 们 已 展示 有 了 这 种 标识 符 ， 束 足以 访问 一 个 System VIA 
息 队 列 〈 假 设 我 们 有 足够 权限 ) 。 对 图 14-4 作 类 似 的 修改 ， 以 展示 同样 
的 特性 也 适用 于 System V 共 享 内 存 区 。 


[1]. 确切 地 说 ， 从 观察 程序 运行 的 用 户 来 看 ， 缓 冲模 式 的 标准 输出 妨碍 
了 父子 进程 动态 输出 的 及 时 反映 。 一 一 译 者 注 


[2]. 意思 十 不 像 调 用 read 和 write 执行 1O 时 那样 由 内 核 直接 参与 TO 的 完 
成 ”而 是 由 内 核 在 背后 通过 操纵 页 表 等 方法 间接 参与 ， 这 样 就 用 户 进 
程 看 来 ，IO 不 再 涉及 系统 调用 。 译 者 注 


[3]. 删除 一 个 共享 内 存 区 指 的 是 使 其 标识 符 失 效 ， 这 样 以 后 针对 该 标识 
符 的 shmat、shmdt 和 shmctl 范 数 调 用 必定 失败 。 拆 除 一 个 共享 内 存 区 指 
的 是 释放 或 回收 与 它 对 应 的 数据 结构 ， 包 括 删 除 存 放 在 其 上 的 数据 。 
拆除 操作 要 到 该 共享 内 存 区 的 引用 计数 变 为 0 时 才 进 行 。 另 外 ， 当 某 个 
shmdt 调 用 发 现 所 指定 的 共享 内 存 区 的 引用 计数 变 为 0 时 也 顺便 拆除 它 
用 发 出 时 会 发 生 的 


15.1 概述 


当 讨 论 客户 -服务 器 情形 和 过 程 调用 时 ， 存 在 着 三 种 不 同类 型 的 过 
程 调用 ， 如 图 15-1 所 示 。 


主机 
REDE a ee T E q 
进程 
| | MEI 
过 程 调用 | ! 返回 本 地 过 程 调 用 
RE | 
主机 
Es E. 
| 客户 进程 B 服务 器 进程 | 
| 过 程 调用 | 单 台 主机 上 的 远 
| | 程 过 程 调 用 ( 门 ) 
| 返回 I 
I | 
和 zi 
主机 主机 
[a> ee Sates Se » [OO ENS ES al 
| l | I 
EET: ME n 1 服务 器 进程 i 
| EET | | 主机 间 的 远程 过 
! 程 调用 (第 16 章 ) 
| 
| E ares ec, s = 


彼此 连接 的 网 络 


图 15-1 三 种 不 同类 型 的 过 程 调用 

(1) 本 地 过 程 调用 (local procedure call) : 这 是 我 们 从 日 常 的 C 编 程 
中 早 就 熟知 的 过 程 调用 ， 也 就 是 被 调用 的 过 程 (ERGO 与 调用 过 程 处 
于 同一 个 进程 中 。 典 型 情况 是 ， 调 用 者 通过 执行 某 条 机 器 指令 把 控制 
RADIE, BORA ERD Les a Fase, FER Oa 
本 地 变量 的 空间 。 

(2) 远 程 过 程 调用 (remote procedure call, RPC) : 被 调用 过 程 和 
调用 过 程 处 于 不 同 的 进程 中 。 我 们 通常 称 调 用 者 为 客户 ， 称 被 调用 的 
过 程 为 服务 右 。 在 图 15-1 中 间 的 情形 中 ， 我 们 展示 客户 和 服务 句 是 在 同 
一 台 主 机 上 执行 的 。 它 是 该 图 底部 的 情形 经 常会 发 生 的 一 种 特殊 情 
况 ， 也 是 门 (door) 所 提供 的 能 力 : 一 个 进程 调用 同一 台 主 机 上 另 一 个 
进程 中 的 某 个 过 程 (函数 ) 。 通 过 给 本 进程 内 的 某 个 过 程 创建 一 个 
门 ， 一 个 进程 (服务 器 ) 就 使 得 该 过 程 能 为 其 他 进程 (客户 ) 所 调 
用 。 我 们 也 可 以 认为 门 是 一 种 特殊 类 型 的 IPC， 因 为 客户 和 服务 器 之 间 
以 函数 参数 和 返回 值 形式 交换 信息 。 

(3)RPC 通 常 允 许 一 台 主 机 上 的 菜 个 客户 调用 男 一 台 主 机 上 的 某 个 
服务 器 过 程 ， 只 要 这 两 台 主 机 以 某 种 形式 的 网 络 连 接着 (图 15-1 底 部 的 
情形 ) 。 我 们 将 在 第 16 章 讲述 这 样 的 RPC。 

从 历史 上 说 ， 门 是 为 Spring 分 布 式 操作 系统 开发 的 ， 有 具体 细节 可 以 
M http :  /www.sun.com/tech/projects/spring 上 得 到 

| Hamilto.an.Kougiouri.1993| 中 有 关于 该 操作 系统 中 门 IPC 机 制 的 一 个 
说 明 。 

后 来 门 添加 到 了 Solaris 2.5 中 ， 不 过 有 天 它 的 唯一 手册 页 面 中 只 合 
有 一 个 警告 ， 说 门 是 仅 由 某 些 Sun 应 用 程序 使 用 的 一 个 试验 性 接口 。 到 
了 Solaris 2.6 后 ， 该 接口 的 文档 出 现在 8 个 手册 页 面 中 ， 不 过 这 些 手册 页 
面 把 该 接口 的 稳定 性 列 为 “进展 中 (evolving) ”。 预 期 我 们 在 本 章 讲述 


的 API 可 能 会 随 Solaris 将 来 版 本 的 出 现 而 发 生变 化 。Linux 上 门 接 口 的 初 
级 版 本 也 在 开发 中 ， 可 访问 http: //www.cs.brown.edu/~tor/doors ° [1] 

Solaris 2.6 中 门 的 实现 涉及 一 个 函数 库 〈 它 含有 我 们 将 在 本 章 中 描 
述 的 door_ XXX 函数 ) 和 一 个 内 核 文 件 系统 (/kernel/sys/doorfs) ， 用 户 
的 应 用 程序 需 链 接 这 个 函数 库 〈 使 用 -ldoor 命 令 行 选 项 链接 程序 ) 。 

尽管 门 是 一 个 Solaris 特 有 的 特性 ， 我 们 还 是 详细 地 讲述 它 ， 因 为 它 
们 提供 了 很 不 错 的 远程 过 程 调用 的 入 门 知识 ， 又 不 必 对 付 任 何 连 网 文 
持 细 方 。 我 们 还 将 在 附录 A 中 看 到 ， 与 所 有 其 他 形式 的 消 恩 传递 机 制 相 
比较 ， 门 不 是 更 快 也 至 少 一 样 快 。 

本 地 过 程 调用 是 同步 的 : 调用 者 直到 被 调用 过 程 返回 后 才 重 新 获 
得 控制 。 线 程 可 认为 是 提供 了 某 种 形式 的 异步 过 程 调 用 : 有 一 个 函数 
被 调用 (pthread_create 的 第 三 个 参数 ) ， 该 男 数 和 调用 者 看 起 来 在 同时 
执行 。 调 用 者 可 通过 调用 pthread_join 等 待 这 个 新 线程 的 完成 远程 过 
程 调用 可 能 是 同步 的 ， 也 可 能 是 异步 的 ， 不 过 我 们 将 看 到 [调用 是 同 
步 的 。 

在 进程 (客户 或 服务 器 ) 内 部 ， 门 是 用 描述 符 标 识 的 。 在 进程 以 
外 ， 门 可 能 是 用 文件 系统 中 的 路 径 名 标识 的 。 一 个 服务 器 通过 调用 
door_create 创 建 一 个 门 ， 传 递 给 该 男 数 的 参数 是 将 与 该 门 关 联 的 过 程 的 
一 个 指针 ， 该 函数 的 返回 值 是 新 创建 的 门 的 一 个 描述 符 。 该 服务 器 然 
后 通过 调用 fattach 给 这 个 门 描述 符 关 联 一 个 路 径 名 。 一 个 客户 通过 调用 
open 来 打开 一 个 门 ， 传 递 给 该 函数 的 参数 是 该 门 鸭 服务 器 关联 在 其 上 
的 路 径 名 ， 该 函数 的 返回 值 是 本 客户 访问 该 门 的 描述 符 。 该 客户 然后 
通过 调用 door_call 调 用 服务 器 过 程 。 目 然 ， 某 个 门 的 服务 妖 可 以 是 为 一 
个 门 的 客户 。 

我 们 说 过 门 调用 是 同步 的 ， 当 客户 调用 door_call 时 ， 该 贸 数 直 到 服 
Saw heel (或 发 生 某 个 错误 ) 时 才 返 回 。Solaris 的 门 实现 还 跟 线程 
相 联 系 。 每 当 有 一 个 客户 调用 某 个 服务 句 过 程 时 ， 服 务 絮 进程 中 的 一 


个 线程 束 处 理 该 客户 的 调用 。 线 程 绾 理 通常 是 由 | ] 芳 数 库 目 动 进行 
的 ， 该 函数 库 根 据 需要 创建 新 的 线程 ， 然 而 我 们 将 看 到 ， 如 果 需 要 服 
务 器 进程 亲 目 管理 这 些 线程 的 话 ， 它 应 该 怎么 去 做 。 这 还 意味 着 一 个 
给 定 的 服务 絮 可 以 同时 为 多 个 客户 调用 同一 个 服务 器 过 程 提 供 服务 ， 
每 个 客户 一 个 线程 。 这 是 一 个 并 发 (concurrent) 服务 器 。 既 然 一 个 给 
定 服务 器 过 程 可 能 有 多 个 实例 在 同时 执行 (每 个 实例 作为 一 个 线 
程 ) ， 因 此 服务 器 过 程 必须 是 线程 安全 的 。 

调用 一 个 服务 器 过 程 时 ， 可 以 同时 从 客户 向 服务 器 传递 数据 和 描 
述 符 。 也 可 以 同时 从 服务 器 向 客户 传递 回 数 据 和 摘 述 符 。 摘 述 符 传 带 
对 于 门 来 说 是 内 在 的 。 而 且 ， 既 然 门 症 用 描述 符 标 识 的 ， 因 此 描述 符 
传递 允许 一 个 进程 把 一 个 门 传递 给 另外 某 个 进程 。 我 们 将 在 15.8 世 详细 
讨论 接 述 符 传 递 。 

例子 

我 们 以 一 个 人 简单 的 例子 开始 关于 门 的 讨论 : 客户 向 服务 屁 传 递 一 
个 长 整数 ， 服 务 絮 以 长 整数 结果 返回 该 值 的 平方 。 图 15-2 给 出 了 客户 程 
Fee (我 们 在 本 例子 中 掩盖 了 许多 细节 ， 它 们 在 本 章 以 后 再 讨论 。) 


doors/clientl.c 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 

5 int fd; 

6 long ival, oval; 

7 door arg t arg; 

8 if (arge Js 3) 

9 err quit("usage: clientl «server-pathname» «integer-value»"); 
10 fd - Open(argv[1], O RDWR); /* open the door */ 

11 /* set up the arguments and pointer to result */ 

12 ival = atol(argv[2]); 

13 arg.data ptr - (char *) &ival; /* data arguments */ 
14 arg.data size = sizeof (long); /* size of data arguments */ 
15 arg.desc ptr - NULL; 

16 arg.desc num - 0; 

17 arg.rbuf - (char *) &oval; /* data results */ 

18 arg.rsize = sizeof (long); /* size of data results */ 
19 /* call server procedure and print result */ 

20 Door call(fd, &arg); 

21 printf("result: %ld\n", oval); 

22 exit (0); 

23 } 


doors/clientl.c 


图 15-2 向 服 务 器 发 送 一 个 长 整数 以 求 取 其 平方 值 的 客户 


打开 门 

8~10 调用 open 打 开 由 命令 行 上 的 路 径 名 指定 的 门 。 所 返回 的 描述 
符 称 为 门 描 述 符 (door descriptor) ， 不 过 我 们 有 时 候 就 称 它 为 门 

(door) 。 

设置 参数 和 指向 结果 的 指针 

117-18 arg 参 数 含 有 一 个 指向 参数 的 指针 和 一 个 指向 结果 的 指针 9 
data ptrf&lu] Z XXHJ*8— T E UP, data sizefTHAE SAN FAL © desc ptr 
和 desc_num 处 理 描 述 符 的 传递 ， 我 们 将 在 15.8 世 中 讲述 。rbuf 指 同 结 
缓冲 区 的 第 一 个 字 节 ，rsize 是 它 的 大 小 。 

调用 服务 器 过 程 并 输出 结果 

19~21 通过 调用 door_call 来 调用 服务 器 过 程 ， 作 为 参数 指定 的 是 
所 打开 的 门 描述 符 和 指 癌 所 设置 参数 结构 的 指针 。 调 用 返回 后 输出 结 
E o 


图 15-3 给 出 了 服务 器 程序 。 它 由 一 个 名 为 servproc 的 服务 器 过 程 和 
一 个 main 函 数 构成 。 

服务 器 过 程 

2--10 调用 服务 器 过 程 需 有 5 个 参数 ， 但 是 我 们 真正 使 用 的 是 


dataptr, RIS XXBJSS— T V? 


通过 该 指针 取出 长 整数 参数 后 求 它 


的 平方 。 然 后 控制 随 结 果 由 door_return 传 递 回 客户 。 该 函数 的 第 一 个 参 
数 是 指 问 结果 的 指针 ， 第 二 个 参数 是 结果 的 大 小 ， 其 余 两 个 参数 处 理 
描述 符 的 返回 。 


1 #include "unpipc.h" 


2 void 


3 servproc(void *cookie, char *dataptr, size t datasize, 


4 
5 { 
6 
7 
8 
9 
10 } 


Ti int 


door desc t *descptr, size t ndesc) 


long arg, result; 


arg - *((long *) dataptr); 
result - arg * arg; 
Door return((char *) &result, sizeof(result), NULL, 0); 


12 main(int argc, char **argv) 


13 ( 
14 


int fd; 


if (argc !- 2) 
err quit("usage: serverl «server-pathname»"); 


/* create a door descriptor and attach to pathname */ 
fd - Door create(servproc, NULL, 0); 


unlink (argv[1]); 
Close(Open(argv[1], O CREAT | O RDWR, FILE MODE)); 
Fattach(fd, argv[11); 


/* servproc() handles all client requests */ 
for (; ; ) 
pause() ; 


图 15-3 返回 一 个 长 整数 的 平方 值 的 服务 器 程序 


创建 一 个 门 描述 符 并 附 接 到 路 径 名 
17~21 调用 door_create 创 建 一 个 门 摘 述 人 符 。 该 函数 的 第 一 个 参数 
是 指向 与 该 门 关 联 的 服务 器 函数 (servproc) 的 指针 。 取 得 门 描述 符 


doors/server l.c 


doors/server l.c 


后 ， 必 须 将 它 与 文件 系统 中 的 一 个 路 径 名 关联 ， 因 为 该 路 径 名 是 客户 
标识 这 个 门 的 手段 。 这 种 关联 通过 在 文件 系统 中 创建 一 个 普通 文件 
(我 们 首先 调用 unlink 以 防 该 文件 已 存在 ， 同 时 忽略 它 的 任何 出 错 返 

回 ) 后 调用 fattach 完 成 ， 其 中 fattach 是 把 一 个 描述 符 与 一 个 路 径 名 相关 
联 的 SVR4 函 数 。 

主 服务 器 线程 不 干 活 

22~24 主 服 务 圳 线程 然后 阻塞 在 一 个 pause 调 用 中 。 上 所 有 工作 全 由 
servproc 五 数 去 做 ， 每 次 有 一 个 客户 请 求 到 达 时 ， 该 函数 就 作为 服务 器 
进程 中 的 另 一 个 线程 来 执行 。 

为 运行 这 个 客户 和 服务 器 程序 ， 我 们 首先 在 一 个 窗口 中 局 动 服务 


solaris 96 server1 /tmp/server1 
然后 在 男 一 个 窗口 中 启动 客户 ， 所 指定 的 路 径 名 参数 与 我 们 传递 
给 服务 如 的 相同 : 


solaris 96 client1 /tmp/server1 9 


result: 81 

solaris 96 ls -l /tmp/server1 

Drw-r--r-- 1 rstevens other1 0 Apr 9 10:09 
/tmp/server1 

结果 与 预期 的 一 致 ， 当 执行 ls 时 ， 我 们 看 到 其 输出 中 第 一 个 字符 为 
D， 表 明 路 径 名 /tmp/server1l 是 某 个 门 的 路 径 名 。 

图 15-4 展 示 了 本 例子 表现 的 行为 过 程 。 它 看 起 来 是 door_call 调 用 了 
服务 器 过 程 ， 服 务 絮 过程 然 后 返回 。 


服务 器 
servproc( ) 
( 


/* do whatever */ 
door return( ); 


过 程 调用 


main( ) 


( 


main( ) 


( 


fd = open(path, ); 


door call(fd, ); 


fa = door. create( ); 
fattach(fd, path); 


图 15-4 从 一 个 进程 到 男 一 个 进程 的 表象 过 程 调用 


图 15-5 展 示 了 调用 同一 台 主 机 上 为 一 个 进程 中 的 某 个 过 程 时 真正 发 
ERITA S 


服务 器 
servproc( ) 


( 
/* do whatever */ 
door return( ); 


客户 


main( ) 


{ 


main( ) 


{ 


1 fd = open(path, ); 


door call(fd, ); £ 


fd = door_create( ); 
fattach(fd, path); 


door. create() 
{ 
) 

门 函数 库 door. return() 


door, call( ) 
( 
6 2 


图 15-5 从 一 个 进程 到 另 一 个 进程 的 过 程 调 用 的 真正 控制 流 
图 15-5 中 发 生 了 以 下 几 个 编 了 号 的 步 又。 


(0) 服 务 器 进程 首先 启动 ， 它 调用 door_create 创 建 一 个 指 代 函数 
servproc 的 门 描述 符 ， 然 后 把 该 描述 符 附 接 到 文件 系统 中 的 某 个 路 径 
名 o 

(客户 进程 启动 ， 它 调用 door_call。 这 实际 上 是 门 函数 库 中 的 一 
个 函数 。 

(2)door_call 库 函数 执行 一 个 进入 内 核 的 系统 调用 。 标 识 出 目标 过 
程 后 ， 控 制 补 传递 到 目标 进程 中 的 某 个 门 库 函 数 。 

(3) 真 正 的 服务 器 过 程 (本 例子 中 名 为 servproc) 被 调用 。 

(4) 服 务 器 过 程 执行 处 理 客 户 请 求 所 需 的 任意 操作 ， 执 行 完 后 调用 
door return ? 

(5)door_return 实 际 上 是 门 函数 库 中 的 一 个 函数 ， 它 执行 一 个 进入 
内 核 的 系统 调用 。 

(6) 标 识 出 客户 后 把 控制 传递 回 该 客户 。 

本 章 其 余 各 节 更 为 详尽 地 讲述 门 API， 同 时 查看 许多 例子 。 在 附录 
人 A 中 我 们 将 看 到 ， 或 延迟 而 言 ，1] 提 供 了 最 快 的 IPC 形 式 。 


15.2 door call 函数 


door_call 画 数 由 客户 调用 ， 它 会 调用 在 服务 如 进程 的 地 址 空间 中 执 
行 的 一 个 服务 器 过 程 。 

#include <door.h> 

int door call(int fd,door arg t *argp); 

返回 : ERIKO, EBEA- 

其 中 描述 符 fd 通 常 是 由 open 返 回 的 《例如 图 15-2) 。 由 客户 打开 并 
将 所 返回 的 挡 述 符 作 为 第 一 个 参数 传递 给 door_cal 的 路 径 名 标识 了 该 函 
数 所 调用 的 服务 器 过 程 。 


第 二 个 参数 argp 指 加 一 个 结构 ， 该 结构 描述 了 调用 参数 和 用 于 容纳 
返回 值 的 缓冲 区 。 
typedef struct door arg 1 
char *data ptr; /* call: ptr to data arguments; 
return: ptr to data results */ 
size t data size; /* call: #bytes of data arguments; 
return: actual £bytes of data results */ 
door desc t *desc ptr; /* call: ptr to descriptor arguments; 
return: ptr to descriptor results */ 
size t desc num; /* call: number of descriptor 
arguments; 


return: number of descriptor results */ 


char *rbuf; /* ptr to result buffer */ 
size t rsize; /* #bytes of result buffer */ 
} door arg t; 


返回 时 也 由 该 结构 描述 返回 值 。 该 结构 的 所 有 6 个 成 员 在 返回 时 都 
AREA, BS Emel 。 

给 其 中 的 两 个 指针 成 员 使 用 char* 数 据 类 型 有 些 奇 怪 ， 为 避免 出 现 
编译 警告 ， 我 们 不 得 不 在 代码 中 显 式 地 对 它们 进行 类 型 强制 转换 。 我 
们 倒 和 希望 它们 是 void* 数 据 类 型 的 指针 。door_retum 的 第 一 个 参数 也 同 
样 使 用 了 char*。Solaris 2.7 也 许 会 把 desc_num 的 数据 类 型 改 为 unsigned 
int, door retum 的 最 后 一 个 参数 也 将 相应 地 作 修 改 。 

无 论 是 参数 还 是 结果 都 存在 两 种 数据 类 型 : 数据 和 摘 述 符 。 

数据 参数 (data arguments) Æ FH data. ptr 指向 的 一 系列 总 共 
data_size 个 字 世 。 客 户 和 服务 器 必须 以 某 种 方式 “知道 "这 些 参 数 (以 及 
结果 ) 的 格式 。 举 例 来 说 ， 无 法 通过 特殊 的 编码 告诉 服务 器 参数 的 数 
据 类 型 。 在 图 15-2 和 图 15-3 中 ， 客 户 程序 和 服务 器 程序 编写 成 知道 参数 


是 一 个 长 整数 ， 结 果 也 是 一 个 长 整数 。 封 半数 据 类 型 信息 的 办 法 之 一 
是 (为 了 若干 年 后 有 人 仍 能 读 懂 代码 ) : 把 所 有 的 参数 放 进 一 个 结构 
中 ， 把 所 有 的 结果 放 进 兄 一 个 结构 中 ， 把 这 两 个 结构 都 定义 在 一 个 头 
文件 中 ， 客 户 程 序 和 服务 器 程序 都 包括 进 这 个 头 文 件 。 我 们 将 随 图 15- 
11 和 图 15-12 给 出 一 个 这 样 的 例子 。 如 果 没 有 数据 参数 ， 我 们 区 把 
data_ptr 指 定 成 一 个 空 指针 ， 把 data_size 指 定 为 0。 

由 于 客户 和 服务 器 处 理 的 是 封装 到 一 个 参数 缓冲 区 和 一 个 结果 组 
冲 区 中 的 二 进 制 参数 和 结果 ， 因 而 隐 含 着 客户 程序 和 服务 器 程序 必须 
以 同样 的 编译 器 编译 的 要 求 。 有 时 候 在 同样 的 系统 上 ， 不 同 的 编译 器 
也 会 以 不 同 的 方式 封 光 结 构 。 

描述 符 参 数 (descriptor arguments) 是 一 个 door_desc_t 结 构 的 数 
组 ， 每 个 元 于 含 有 一 个 从 客户 往 服务 絮 过 程 传递 的 揪 述 符 。 所 传递 的 
door_desc_t 结 构 数 为 desc_num。 (我 们 将 在 15.8 节 描述 这 个 结构 以 及 
“传递 描述 符 ” 的 含义 。) 如 果 没 有 描述 符 参 数 ， 我 们 就 把 desc_ptr 指 定 
成 一 个 空 指针 ， 把 desc_num 指 定 为 0。 

返回 时 data_ptr 指 向 数据 结果 (data results) ，data_size 则 指定 这 些 
结果 的 大 小 。 如 果 没 有 数据 结果 ，data_size 就 为 0， 这 时 我 们 应 该 忽略 
data ptr ° 

返回 时 也 可 能 有 描述 符 结果 (descriptor results) : desc_ptr 指 向 一 
个 door_desc_t 结 构 的 数组 ， 每 个 元 素 含 有 一 个 由 服务 絮 过 程 传递 回 客 
户 的 描述 符 。 所 返回 的 door_desc_t 结 构 数 存放 在 desc_num 中 。 如 果 没 
有 描述 符 结 有 果 ，desc_num 就 为 0， 这 时 我 们 应 该 名 上 略 desc_ptr。 

给 参数 和 结 采 使 用 同样 的 缓冲 区 是 可 行 的 。 这 就是 说 调用 door_call 
Pf, data ptrldesc ptráb A] #815] EHrbufTRAEBJZA IR [X FH. o 

在 调用 door call 前， 客户 把 rbuf 设 置 成 指 回 存放 结果 的 缓冲 区 ， 把 
rsize 设 置 成 该 缓冲 区 的 大 小 。 返 回 时 data_ptr 和 desc_ptr 通 常 都 指向 这 个 
结果 缓 神 区 中 。 如 采 该 缓冲 区 太 小 而 容纳 不 了 服务 圳 的 结果 ， 门 函数 


库 就 会 在 调用 者 的 地 址 空间 中 使 用 mmap (12.28) 自动 分 配 一 个 新 的 
缓冲 区 ， 然 后 相应 地 更 新 tbuf 和 rsize。data_ptr 和 desc_ptr 将 指向 这 个 新 
分 配 的 缓冲 区 中 。 留 意 rbuf 的 变化 并 在 以 后 某 个 时 刻 以 rbuf 和 rsize 为 参 
数 调用 munmap 把 门 六 数 库 分 配 的 缓冲 区 返还 给 系统 ， 这 些 是 调用 者 的 
责任 。 我 们 将 随 图 15-7 给 出 这 样 的 一 个 例子 。 


15.3 door create AN 


服务 器 进程 通过 调用 door_create 建 立 一 个 服务 器 过 程 。 

#include <door.h> 

typedef void Door server proc(void *cookie,char *dataptr,size_t 
datasize, 

door desc t *descptr,size t ndesc); 
int door create(Door server proc *proc,void *cookie,u int attr); 
RE: 大 成 功 则 为 非 负 描述 符 ， 才 出错 则 为 -1 

在 上 述 的 声明 中 ， 我 们 加 上 了 上 自己 的 typedef ， 这 样 简 化 了 服务 器 
过 程 的 函数 原型 。 这 个 typedef 语 句 说 ， 门 服务 器 过 程 (例如 图 15-3 中 的 
servproc) 是 以 5 个 参数 调用 的 ， 不 返回 任何 值 。 

当 一 个 服务 如 调 用 door_create 时 ， 传 递 给 该 函数 的 第 一 个 参数 proc 
是 一 个 服务 絮 过 程 的 地 址 ， 该 服务 絮 过 程 将 与 由 该 贸 数 返回 的 门 摘 述 
符 相 关联 。 当 调用 这 个 服务 器 过 程 时 ， 它 的 第 一 个 参数 cookie 是 作为 
door_create 的 第 二 个 参数 传递 进去 的 值 。 这 么 一 来 给 服务 句 提 供 了 辣 服 
务 器 过 程 传递 某 个 指针 的 一 种 方式 ， 该 指针 在 每 次 有 一 个 客户 调用 该 
过 程 时 传递 。 服 务 器 过 程 的 以 后 4 个 参数 (dataptr ^ datasize ^ descptr ^ 
ndesc) 描述 来 自 服务 器 的 数据 参数 和 描述 符 参 数 ， 也 就 是 上 一 节 中 描 
述 的 door_arg_t 结 构 的 前 4 个 成 员 所 描述 的 信息 。 


door_create 的 最 后 一 个 参数 attr 描 述 所 创建 服务 器 过 程 的 特殊 属 
性 ， 它 或 为 0， 或 为 以 下 两 个 常 值 的 按 位 或 。 

DOOR PRIVATE 随 春 客户 请 求 的 到 达 ， 门 函数 库 在 服务 器 进程 中 
自动 创建 必要 的 新 线程 以 调用 服务 器 过 程 。 按 照 默 认 设 置 ， 这 些 线程 
放 在 进程 范围 的 线程 池 中 ， 可 用 于 给 服务 器 进程 中 的 任何 门 提供 客户 
请 求 的 服务 。 指 定 DOOR_PRIVATE 属 性 就 是 告诉 门 落 数 库 该 门 得 有 自 
己 的 服务 器 线程 池 ， 与 进程 范围 的 池 分 开 。 

DOOR UNREF 当 指 代 该 门 的 描述 符 数 从 2 降 为 1 时 ， 将 第 二 个 参数 

(dataptr) 指定 为 DOOR_UNREF_DATA 再 次 调用 该 服务 器 过 程 。 这 次 
调用 的 descptr 参 数 是 一 个 空 指 针 ，datasize 和 ndesc 则 均 为 0。 我 们 将 从 图 
15-16 的 讨论 开始 给 出 这 个 属性 的 一 些 例子 。 

服务 器 过 程 的 返回 值 声 明 为 void， 因 为 它们 从 不 通过 调用 retum 或 
擅 出 函数 尾 返回 。 写 们 会 调用 我 们 将 在 下 一 下 摘 述 的 door_return。 

我 们 从 图 15-3 中 已 看 到 ， 调 用 door_create 获 取 一 个 门 描述 符 之 后 ， 
服务 器 通常 调用 fattach 给 该 描述 符 关 联 以 一 个 文件 系统 中 的 路 径 名 。 窗 
户 open 该 路 径 名 就 获得 了 调用 door_call 所 需 的 门 描述 符 。 

fattach 不 是 一 个 Posix.1 画 数 ， 但 是 Unix 98 却 需要 它 。 男 外 ， 有 一 
个 名 为 fdetach 的 函数 撤销 这 种 关联 ， 名 为 fdetach 的 命令 则 简单 地 激活 该 

由 door_create 创 建 的 门 描述 符 在 其 文件 描述 符 标 志 中 设置 了 
FED_CLOEXEC 位 。 这 意味 着 创建 一 个 门 描述 符 的 进程 如 果 调 用 了 任意 
一 个 exec 函 数 ， 该 搞 述 符 束 被 内 核 天 财 。 至 于 fork， 尽 管 父 进程 中 已 打 
开 的 所 有 描述 符 随 后 为 子 进程 所 共享 ， 却 只 有 父 进 程 会 收 到 来 自 客户 
的 门 激活 请 求 ， 这 些 请 求 不 会 递交 给 子 进 程 ， 即 使 由 door_create 返 回 的 
描述 符 在 子 进 程 中 也 是 打开 的 。 

如 果 我 们 把 一 个 门 考 虚 成 是 由 一 个 进程 D 和 答 调 用 的 相应 服务 妖 
过 程 的 地 址 标识 的 (我们 将 从 在 15.6 节 介绍 的 door_info_t 结 构 中 看 到 这 


两 个 标识 信息 ) ， 那 么 关于 fork 和 exec 的 这 两 条 规则 就 有 意义 了 “。 子 进 
程 永远 得 不 到 门 激活 请 求 是 因为 与 该 门 关 联 的 进程 ID 是 调用 door_create 
的 父 进程 的 进程 ID。 遇 到 exec 调 用 时 门 朱 述 符 必 须 头 闭 的 原因 则 在 
于 ， 即 使 进程 ID 没有 改 ， 与 该 门 天 联 的 服务 万 过 程 的 地 址 在 exec 之 
后 痢 激 活 的 程序 中 已 失去 意义 。 


15.4 door. return HŽ 


服务 器 过 程 完 成 工作 时 通过 调用 door_ return 返 回 。 这 会 使 客户 中 相 
关联 的 door_call 调 用 返回 。 


#include <door.h> 


int door_return(char *dataptr,size_t datasize,door_desc_t 
*descptr,size_t *ndesc); 
返回 : 奉 成 功 则 不 返回 到 调用 者 ， 奉 出 错 则 为 -1 
数据 结果 由 dataptr 和 datasize 指 定 ， 摘 述 符 结果 由 descptr 和 ndesc 指 
Æ o 


15.5 door cred EX 2 


门 有 一 个 很 不 错 的 特性 : 服务 器 过 程 能 够 获取 每 个 调用 对 应 的 客 
户 任 证。 这 是 由 door_cred 函 数 完 成 的 。 
#include <doorh> 
int door cred(door cred t *cred); 
返回 : ERDIAK, Æ EEA- 
其 中 由 cred 指 癌 的 door_cred_t 结 构 将 在 返回 时 填 入 客户 的 凭证 。 
typedef struct door_cred { 
uid tdc euid; /* effective user ID of client */ 


gid tdc egid; /* effective group ID of client */ 


uid tdc ruid; /* real user ID of client */ 
gid tdc rgid; /* real group ID of client */ 
pid tdc pid; /* process ID of client */ 
} door cred t; 
APUE 的 4.4 玫 讨论 了 有 效 ID 和 实际 ID 之 间 的 差别 ， 我 们 将 随 图 15-8 
给 出 体现 这 种 差异 的 一 个 例子 。 
注意 本 函数 中 没有 描述 符 参数 。 本 函数 返回 发 起 当前 门 激活 请 求 
的 客户 的 有 天 信息 ， 因 而 必须 在 服务 句 过 程 或 由 该 过 程 调 用 的 某 个 芳 
数 中 调用 它 。 


15.6 door _ info 函数 


我 们 刚才 接 述 的 door_cred 芳 数 给 服务 右 提 供 天 于 客户 的 信息 。 客 
户 也 可 通过 调用 door_info 函 数 找 出 有 关 服 务 器 的 信息 。 


#include <door.h> 


int door_info(int fd,door_info_t *info); 
返回 : ERDIAK, Æ EA- 
HrBfdfakE— T EFT FFA] * Hinfots I] Hjdoor. info. t£& 4 ER 
[ES] LA DR T- ARS ese, ° 


typedef struct door info { 


pid t di target; /* server process ID */ 

door ptr t di proc; /* server procedure */ 

door ptr t di data; /* cookie for server procedure */ 
door attr t di attributes; /* attributes associated with door */ 
door id t di uniquifier; /* unique number */ 


) door info t; 


其 中 di_target 是 服务 器 的 进程 ID ，di_proc 是 所 指定 的 服务 器 过 程 在 
服务 器 进程 中 的 地 址 (对 于 客户 来 说 ， 这 个 地 址 信息 也 许 没什么 
H) 。 作 为 第 一 个 参数 传递 给 该 服务 器 过 程 的 cookie 指 针 由 di_data 返 
加 | o 

该 门 的 当前 属性 存放 在 di_attributes 中 ， 我 们 已 在 15.3 节 中 描述 过 两 
个 属性 : DOOR PRIVATE 和 DOOR UNREF 。 两 个 新 属性 是 
DOOR LOCAL (该 过 程 局 部 于 本 进程 ， 和 DOOR_REVOKE (服务 器 
已 通过 调用 door_revoke 国 数 撤销 了 与 该 门 天 联 的 过 程 ;。 

每 个 门 刚 被 创建 时 都 被 赋予 一 个 系统 范围 内 唯一 的 数值 ， 它 作为 
di uniquifierjX |E] ° 

本 函数 通常 由 客户 调用 ， 以 获取 关于 服务 器 的 信息 。 然 而 它 也 可 
以 由 一 个 服务 器 过 程 调 用 ， 这 时 第 一 个 参数 指定 为 DOOR_QUERY， 所 
返回 的 信息 是 关于 调用 线程 的 。 这 种 情形 下 ， 服 务 器 过 程 的 地 址 

(di_proc) 和 cookie (di_data) 也 许 有 用 。 


15.7 例子 


现在 给 出 使 用 之 前 所 述 五 个 函数 的 一 些 例子 。 

15.7.1 door_info žit 

图 15-6 给 出 的 程序 打开 一 个 门 ， 调 用 door_info， 然 后 输出 关于 该 门 
的 信息 。 


1 #include "unpipc.h" 


2 int 
3 main(int argc, char **argv) 
4 { 


doors/doorinfo.c 


5 int fd; 

6 struct stat stat; 

7 struct door infoinfo; 

8 if (argc !- 2) 

9 err quit("usage: doorinfo <pathname>") ; 
10 fd - Open(argv[1], O RDONLY); 

liL Fstat(fd, &stat); 

12 if (S ISDOOR(stat.st mode) 0) 

13 err quit("pathname is not a door"); 

14 Door info(fd, &info); 

15 printf ("server PID = $1d, uniquifier = $1d", 
16 (long) info.di target, (long) info.di uniquifier); 
17 if (info.di attributes & DOOR LOCAL) 

18 printf(", DOOR LOCAL"); 

19 if (info.di attributes & DOOR PRIVATE) 

20 printf(", DOOR PRIVATE"); 

21 if (info.di attributes & DOOR REVOKED) 

22 printf(", DOOR REVOKED"); 

23 if (info.di attributes & DOOR UNREF) 

24 printf(", DOOR UNREF"); 

25 printf ("Mn"); 

26 exit (0); 

27 ) 


statź 


图 15-6 输出 关于 一 个 门 的 信息 


doors/doorinfo.c 


我 们 open 所 指定 的 路 径 名 并 首先 验证 它 是 一 个 门 。 对 应 一 个 门 的 


吉 构 的 st_mode 成 员 含 有 


我 们 接着 调用 door_info ° 
我 们 首先 指定 一 个 不 是 门 的 路 径 名 运行 该 程序 ， 然 后 针对 Solaris 
2.6 所 用 的 两 个 门 运行 它 


solaris % doorinfo ee 


pathname is not a door 


个 值 ， 该 值 使 得 9_ISDOOR 宏 求 值 为 真 。 


solaris 96 doorinfo /etc/.name service door 

server PID = 308,uniquifier = 18,DOOR, UNREF solaris 96 doorinfo 
/etc/.syslog door 
server PID = 282,uniquifier = 1635 


solaris 96 ps -f -p 308 


root 308 1 0 Apr01? 0:34 /usr/sbin/nscd 
solaris 96 ps -f -p 282 
root 282 1 0 Apr01? 0:10 /usr/sbin/syslogd - 
n -z 14 


我 们 使 用 ps 命令 来 查看 以 由 door_info 返 回 的 进程 ID 运行 的 是 什么 


程序 。 


15.7.2 结果 缓冲 区 大 小 
在 描述 door_call 画 数 时 我 们 提 到 过 ， 如 果 结 果 绥 冲 区 太 小 而 容纳 不 


了 服务 如 


的 结果 ， 门 函数 库 丈 会 目 动 分 配 一 个 新 的 缓冲 区 。 我 们 现在 


给 出 展示 这 一 特性 的 一 个 例子 。 图 15-7 给 出 了 新 的 客户 程序 ， 它 是 对 图 
15-2 的 简单 修改 。 


doors/client2.c 


1 #include "unpipc.h" 

2 Ent 

3 main(int argc, char **argv) 

4 ( 

5 int fd; 

6 long ival, oval; 

7 door arg t arg; 

8 if (arge l= 3) 

9 err quit("usage: client2 «server-pathname» <integer-value>") ; 
10 fd - Open(argv[1], O RDWR); /* open the door */ 

11 /* set up the arguments and pointer to result */ 

12 ival = atol(argv[2]); 

13 arg.data_ptr = (char *) &ival;/* data arguments */ 

14 arg.data size - sizeof(long); /* size of data arguments */ 
15 arg.desc ptr - NULL; 

16 arg.desc num - 0; 

17 arg.rbuf - (char *) &oval; /* data results */ 

18 arg.rsize - sizeof (long); /* size of data results */ 
19 /* call server procedure and print result */ 

20 Door call(fd, &arg); 
21 printf("&oval = $p, data ptr = $p, rbuf = $p, rsize = %d\n", 
22 &oval, arg.data ptr, arg.rbuf, arg.rsize); 
23 printf("result: %ld\n", *((long *) arg.data ptr)); 
24 exit(0); 

25 } 


doors/client2.c 


图 15-7 输出 结果 的 地 址 


19~23 在 这 个 版 本 的 程序 中 ， 我 们 输出 oval 变 量 的 地 址 、data_ptr 

的 内 容 〈 它 指向 从 door_call 返 回 的 结果 ) 以 及 结果 缓冲 区 的 地 址 和 大 小 
(rbuf 和 rsize) ° 

这 时 运行 该 程序 ， 我 们 还 没有 修改 来 自 图 15-2 的 结果 缓冲 区 的 大 
小 ， 因 此 预期 data_ptr 和 rbuf 都 指 癌 oval 变 量 ，rsize 则 为 4 字 方 。 确 实 ， 
这 跟 我 们 实际 看 到 的 一 致 

solaris 96 client2 /tmp/server2 22 

&oval = effff740,data ptr =effff740,rbuf = effff740,rsize = 4 

result: 484 

Suck Reo 15-777 —47, TERT RAR IR CA a TET ° 
新 版 本 中 将 图 15-7 的 第 18 行 改 为 如 下 : 

arg.rsize = sizeof(long)- 1; /* size of data results */ 

执行 这 个 新 的 客户 程序 ， 我 们 看 到 分 配 了 一 个 新 缓冲 区 ，data_ptr 
WETS ALIAS BERTH DX, © 

solaris % client3 /tmp/server3 33 

&oval = effff740,data_ptr =ef620000,rbuf = ef620000,rsize = 4096 

result: 1089 

ATTACH KAIK MEZRA EREK, BAT C EI12.6 
中 看 到 过 这 个 大 小 。 从 这 个 例子 可 以 看 出 ， 我 们 应 该 总 是 通过 data_ptr 
指针 访问 服务 器 的 结果 ， 而 不 能 通过 其 地 址 在 rbuf 中 传递 给 服务 句 的 变 
量 。 这 束 是 说 在 我 们 的 例子 中 ， 我 们 应 该 以 *((long*)arg.data_ptr) 访 问 
长 整数 结果 ， 而 不 是 以 oval 来 访问 (图 15-2 中 是 这 么 做 的 。 

通过 调用 mmap 分 配 的 这 个 新 缓冲 区 可 使 用 munmap 返 还 给 系统 。 
客户 也 可 以 给 后 续 的 door_call 调 用 一 直 使 用 该 缓冲 区 。 

15.7.3 door_cred 函 数 和 客户 凭证 


这 一 次 我 们 对 图 15-3 中 的 servproc 函 数 做 了 修改 : Vid door cred 
数 来 获取 客户 的 赁 证。 图 15-8 给 出 了 这 个 新 的 服务 器 过 程 ， 客 户 和 服务 
armain KA, 5 AE É115-240 A]15-3 ° 


doors/server4.c 
1 #include "unpipc.h" 
2 void 
3 servproc(void *cookie, char *dataptr, size t datasize, 
4 door desc t *descptr, size t ndesc) 
5 { 
6 long arg, result; 
7 door cred t info; 
8 /* obtain and print client credentials */ 
9 Door cred(&info); 
10 printf ("euid = $1d, ruid = $1d, pid = %1ld\n", 
11 (long) info.dc euid, (long) info.dc ruid, (long) info.dc pid); 
12 arg - *((long *) dataptr); 
13 result - arg * arg; 
14 Door return((char *) &result, sizeof(result), NULL, 0); 
15 } 


doors/server4.c 


图 15-8 获取 并 输出 客户 凭证 的 服务 器 过 程 

首先 运行 客户 程序 ， 正 如 所 料 ， 我 们 将 看 到 有 效用 户 ID 等 于 实际 
用 户 ID。 接 着 变换 为 超级 用 户 ， 把 客户 程序 可 执行 文件 的 属 主 改 为 
root， 并 启用 该 文件 的 SUID 位 ， 然 后 再 次 运行 客户 程序 。 [2] 


solaris % client4 /tmp/server4 77 第 一 次 运行 客户 程序 
result: 5929 

solaris % su 变 为 超级 用 户 
Password: 

Sun Microsystems Inc. SunOS 5.6 Generic August 1997 


solaris # cd 含有 客户 程序 可 执行 文件 的 目录 

solaris # ls -l client4 

-TIWXrWXI-X 1 rstevens other1 139328 Apr 13 06:02 client4 
solaris 4 chown root client4 把 属 主 改 为 root 
solaris # chmod uts client4 并 打开 SUID 位 


solaris # Is -l client4 检查 文件 权限 与 属 主 
-TWSIWXI-X 1 root other1 139328 Apr 13 06:02 client4 
solaris # exit 


solaris 96 ls -l client4 


-rwsrwxr-x 1 root other1 139328 Apr 13 06:02 client4 
solaris % client4 /tmp/server4 77 然后 再 次 运行 客户 程序 


result: 5929 

查看 服务 器 的 输出 ， 我 们 看 到 第 二 次 运行 客户 程序 时 ， 有 效用 户 
ID 发 生 了 变化 。 

solaris 96 server4 /tmp/server4 

euid = 224,ruid = 224,pid = 3168 

euid = O,ruid = 224,pid =3176 

其 中 有 效用 户 ID 为 0 表示 超级 用 户 。 

15.7.4 服务 器 的 自动 线程 管理 

为 了 查看 由 服务 器 执行 的 线程 管理 ， 我 们 让 服务 器 过 程 在 一 开始 
执行 时 输出 自己 所 在 线程 的 线程 ID， 然 后 让 它 睡 眠 5 秒 ， 以 此 模拟 一 个 
运行 时 间 较 长 的 服务 絮 过 程 。 这 上 段 睡眠 使 我 们 可 以 在 已 有 一 个 客户 正 
在 接受 服务 期 间 局 动 多 个 客户 。 图 15-9 给 出 了 新 的 服务 器 过 程 。 


doors/server5.c 


1 #include "unpipc.h" 


2 void 
3 servproc(void *cookie, char *dataptr, size t datasize, 
door desc t *descptr, size t ndesc) 


小 


5 { 

6 long arg, result; 

7 arg = *((long *) dataptr) ; 

8 printf ("thread id tld, arg = $1dWMn", pr_thread_id(NULL), arg); 
9 sleep (5); 


10 result = arg * arg; 
11 Door_return((char *) &result, sizeof(result), NULL, 0); 
12 } 


doors/server5.c 


Ed 15-9 输出 线程 ID 后 睡眠 的 服务 器 过 程 


其 中 引入 了 来 自我 们 自己 的 函数 库 的 一 个 新 函数 pr thread id。 
需要 一 Tee DE uu E T 
的 空 指针 ) ， 返 回 的 是 该 线程 的 一 个 long 类 型 的 整数 标识 符 (往往 是 一 
个 小 整数 ) 。 一 个 进程 总 是 可 以 由 一 个 整数 值 来 标识 ， 这 个 整数 就 是 
它 的 进程 ID。 即 使 我 们 不 清楚 进程 ID 是 int 类 型 还 是 long 类 型 ， 也 只 需 
把 getpid 的 返回 值 类 型 强制 转换 成 long 类 型 后 输出 其 值 (图 9-2) 。 但 是 
线程 的 标识 符 是 一 个 pthread_t 数 据 类 型 的 值 〈 称 为 线程 ID) ， 它 不 必 是 
一 个 整数 。 事 实 上 ，Solaris 2.6 使 用 小 整数 作为 线程 ID Digital Unix 则 
使 用 指针 。 然 而 我 们 往往 希望 只 给 线程 输出 一 个 小 整数 标识 符 (本 例 
子 就 是 这 样 ) ， 以 用 于 调试 目的 。 图 15-10 给 出 的 pr_thread_id 库 函数 可 
处 理 这 个 问题 。 


libAvrappthread.c 


245 long 

246 pr_thread_id(pthread_t *ptr) 

247 { 

248 dif defined (sun) 

249 return((ptr == NULL) ? pthread_self() : *ptr); /* Solaris */ 


250 #elif defined( osf ) && defined(__alpha) 
251 pthread_t tid; 


252 tid - (ptr -- NULL) ? pthread self() : *ptr; /* Digital Unix */ 
253 return (pthread_getsequence_np (tid) ) ; 

254 #else 

255 /* everything else */ 

256 return((ptr == NULL) ? pthread_self() : *ptr); 

257 #endif 

258 } 


lib/wrappthread.c 


图 15-10 pr_thread_id 函 数 : 给 调用 线程 返回 小 整数 标识 符 


如 果实 现 没 有 给 线程 提供 小 整数 标识 答 ， 这 个 函数 束 可 能 复杂 得 
多 ， 需 要 把 pthread_t 值 映射 成 小 整数 ， 并 记 住 这 种 映射 关系 (存放 在 一 
个 数组 或 链表 中 ) ， 供 以 后 的 调用 使 用 。 [Lewis and Berg 1998] 中 的 
thread_name 函 数 完成 了 这 个 工作 。 

返回 图 15-9， 我 们 接连 运行 客户 程序 三 次 。 由 于 我 们 在 启动 下 一 个 
客户 之 前 等 待 shell 提 示 符 ， 因 此 知道 每 次 在 服务 器 端的 5 秒 钟 等 待 都 是 


整 的 。 

solaris 96 client5 /tmp/server5 55 

result: 3025 

solaris 96 client5 /tmp/server5 66 

result: 4356 

solaris 96 client5 /tmp/server5 77 

result: 5929 

查看 服务 如 的 输出 ， 我 们 看 到 同一 个 服务 句 线 程 为 每 个 客户 提供 


di 


solaris 96 server5 /tmp/server5 
thread id 4,arg = 55 
thread id 4,arg = 66 
thread id 4,arg = 77 
现在 同时 局 动 三 个 客户 : 
solaris 96 client5 /tmp/server5 11 & client5 /tmp/server5 22 & V 


client5 /tmp/server5 33 & 


[2] 3812 
[3] 3813 
[4] 3814 
solaris96 result: 484 
result: 121 


result: 1089 
服务 右 的 输出 表明 ， 服 务 器 进程 创建 了 两 个 新 线程 来 处 理 同 一 个 
服务 器 过 程 的 第 二 次 和 第 三 次 激活 请 求 。 
thread id 4,arg = 22 
thread id 5,arg = 11 
thread id 6,arg = 33 


接着 同时 启动 男 外 两 个 客户 : 
solaris 96 client5 /tmp/server5 11 & client5 /tmp/server5 22 & 
[2] 3830 
[3] 3831 
solaris% result: 484 
result: 121 
我 们 看 到 服务 器 使 用 的 是 以 前 创建 的 线程 : 
thread id 6,arg = 22 
hread id 5,arg = 11 
从 本 例子 可 以 看 出 ， 服 务 器 进程 (实际 上 是 跟 我 们 的 服务 器 代码 
相 链 接 的 门 函数 库 ) 根据 需要 自动 创建 服务 器 线程 。 如 果 一 个 应 用 程 
序 和 希望 亲自 处 理 线程 的 管理 ， 那 么 它 可 以 使 用 我 们 将 在 15.9 节 中 描述 的 
我 们 还 验证 了 服务 器 过 程 是 一 个 并 发 (concurent) 服务 器 : 同一 
个 服务 器 过 程 同 时 可 有 多 个 实例 在 运行 ， 它 们 作为 彼此 独立 的 线程 给 
不 同 的 客户 提供 服务 。 认 定 服务 器 并 发 的 第 一 个 办 法 是 ， 当 我 们 同时 
运行 三 个 客户 时 ， 所 有 三 个 结果 都 在 5 秒 后 输出 。 村 是 服务 硕 是 友 代 的 
(iterative) ， 那 么 第 一 个 结果 在 所 有 三 个 客户 都 启动 后 过 5 秒 输出 ， 下 
一 个 结果 再 过 5 秒 输出 ， 最 后 一 个 结果 又 过 5 秒 后 才 输 出。 
15.7.5 服务 器 的 自动 线程 管理 : 多 个 服务 器 过 程 
前 一 个 例子 的 服务 句 进 程 中 只 有 一 个 服务 絮 过 程 。 我 们 的 下 一 个 
问题 是 ， 同 一 服务 絮 进 程 中 的 多 个 服务 句 过 程 是 否 可 以 使 用 同一 个 线 
程 池 。 为 测试 这 一 感 ， 我 们 给 服务 右 进 程 增加 了 男 一 个 服务 器 过 程 ， 
同时 重新 编写 了 前 一 个 例子 的 代码 ， 以 表现 出 在 不 同 进程 间 处 理 参数 
和 结果 的 一 种 更 好 的 风格 。 
我 们 的 第 一 个 文件 是 名 为 squareproc.h 的 头 文 件 ， 它 给 我 们 的 求 平 
方 函 数 定 义 了 一 个 输入 参数 的 数据 类 型 和 一 个 输出 参数 的 数据 类 型 。 


mM 


已 还 给 该 过 程 定义 了 路 径 名 。 图 15-11 给 出 了 该 文件 。 


doors/squareproc.h 


1 #define PATH SQUARE DOOR "/tmp/squareproc door" 

2 typedef struct { /* input to squareproc() */ 

3 long argl; 

4 ) squareproc in t; 

5 typedef struct { /* output from squareproc() */ 
6 long resl; 


7 } squareproc out t; 
doors/squareproc.h 


图 15-11 squareproc.h3- fF 

我 们 的 新 服务 器 过 程 接 受 一 个 长 整数 输入 值 ， 返 回 一 个 double 类 型 
的 值 ， 该 值 是 输入 值 的 平方 根 。 我 们 在 sqrtproc.h 头 文件 中 定义 了 该 过 
程 的 路 径 名 、 输 入 结构 和 输出 结构 ， 图 15-12 给 出 了 该 文件 。 


doors/sqrtproc.h 


1 #define PATH SQRT DOOR  "/tmp/sqrtproc door" 


2 typedef struct { /* input to sqrtproc() */ 
3 long argl; 
4 ) sqrtproc_in t; 


5 typedef struct ( /* output from sqrtproc() */ 

6 double resl; 

7 ) sqrtproc_out t; 

doors/sqrtproc.h 


图 15-12 sqrtproc.h 头 文件 

我 们 的 客户 程序 在 图 15-13 中 给 出 。 它 只 是 一 先 一 后 调用 那 两 个 服 
务 器 过 程 ， 然 后 输出 结果 。 该 程序 与 本 章 中 已 给 出 的 其 他 客户 程序 类 
似 。 


doors/client7.c 


1 #include "unpipc.h" 

2 #include "squareproc.h" 

3 #include "sqrtproc.h" 

4 int 

5 main(int argc, char **argv) 

6 { 

7 int fdsquare, fdsqrt; 

8 door arg t arg; 

9 Squareproc in t square in; 
10 Squareproc out t square out; 
11 Sqrtproc int sqrt_in; 
12 Sqrtproc out t sqrt out; 
13 if (arge != 2) 
14 err quit("usage: client7 <integer-value>") ; 
15 fdsquare - Open(PATH SQUARE DOOR, O RDWR); 
16 fdsqrt - Open(PATH SQRT DOOR, O RDWR); 
17 /* set up the arguments and call squareproc() */ 
18 Square in.argl = atol(argv[1]); 

19 arg.data ptr - (char *) &square in; 
20 arg.data size - sizeof(square in); 
21 arg.desc ptr - NULL; 
22 arg.desc num - 0; 
23 arg.rbuf - (char *) &square out; 
24 arg.rsize = sizeof (square out); 
25 Door call(fdsquare, &arg); 
26 /* set up the arguments and call sqrtproc() */ 
27 Sqrt in.argl - atol(argv[1]); 
28 arg.data ptr = (char *) &sqrt in; 
29 arg.data size = sizeof (sqrt in); 

30 arg.desc ptr - NULL; 

31 arg.desc num - 0; 

32 arg.rbuf - (char *) &sgrt out; 
33 arg.rsize = sizeof (sqrt out); 

34 Door call(fdsqrt, &arg) ; 

35 printf ("result: $1d %g\n", square out.resl, sqrt_out.res1) ; 
36 exit (0); 
37 } 


doors/client7.c 


图 15-13 调用 求 平方 过 程 和 求 平方 根 过 程 的 客户 程序 


图 15-14 给 出 了 我 们 的 两 个 服务 右 过 程 。 每 个 过 程 输出 其 所 在 线程 
的 线程 ID 和 输入 参数 ， 睡 眠 5 秒 钟 ， 计 算 结 有 末 ， 然 后 返回 。 


图 15-15 给 出 的 服务 器 程序 main 范 数 打开 两 个 门 描 述 符 ，: 


个 门 搬 述 符 天 联 一 个 服务 器 过 程 。 


1 #include "unpipc.h" 

2 #include «math.h» 

3 #include "Squareproc.h" 

4 #include "Sqrtproc.h" 

5 void 

6 squareproc(void *cookie, char *dataptr, size t datasize, 
7 door desc t *descptr, size t ndesc) 

8 { 

9 Squareproc in t in; 

10 Squareproc out tout; 

TE memcpy (&in, dataptr, min (sizeof (in), datasize)); 
12 printf("squareproc: thread id $1d, arg = %ld\n", 
13 pr thread id(NULL), in.argl); 

14 Sleep(5); 

15 out.resl = in.argl * in.argl; 

16 Door return((char *) &out, sizeof(out), NULL, 0); 
17 ) 

18 void 

19 sqrtproc(void *cookie, char *dataptr, size t datasize, 
20 door desc t *descptr, size t ndesc) 

21 1 

22 sqrtproc int in; 

23 Sqrtproc out t out; 

24 memcpy(&in, dataptr, min(sizeof(in), datasize)); 
25 printf("sqrtproc: thread id $1d, arg = %ld\n", 

26 pr thread id(NULL), in.argl); 

27 sleep(5); 

28 out .zesl = sqrt((double) in.argl); 

29 Door return((char *) &out, sizeof(out), NULL, 0); 
30 ) 


图 15-14 两 个 服务 器 过 程 


ILES 


BN 


doors/server7.c 


doors/server7.c 


doors/server7.c 


31 int 

32 main(int argc, char **argv) 

33 ( 

34 int fd; 

35 if (argc l= I) 

36 err quit ("usage: server7") ; 

37 fd = Door_create(squareproc, NULL, 0); 

38 unlink (PATH SQUARE DOOR); 

39 Close (Open (PATH SQUARE DOOR, O CREAT | O RDWR, FILE MODE)); 
40 Fattach(fd, PATH SQUARE DOOR) ; 

41 fd = Door_create(sqrtproc, NULL, 0); 

42 unlink (PATH_SQRT_DOOR) ; 

43 Close (Open (PATH SQRT DOOR, O CREAT | O_RDWR, FILE MODE) ) ; 
44 Fattach(fd, PATH SQRT DOOR); 

45 For (ox) 

46 pause () ; 

47 ) 


doors/server7.c 


图 15-15 服务 器 程序 main 函 数 

我 们 运行 客户 程序 ， 它 需 花 10 秒 钟 才 输出 结果 (正如 我 们 的 预 
料 ) 。 

solaris 96 client7 77 

result: 5929 8.77496 

BAMA RBS. Ba EARS SX EE PR] — BEER Mh T YATE 
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solaris 96 server7 


squareproc: thread id 4,arg = 77 

sqrtproc: thread id 4,arg = 77 

xx BUT SU, SPP EERE, ARB ae ST TE 
意 线程 都 能 够 处 理 针对 任意 服务 器 过 程 的 客户 请 求 。 

15.7.6 服务 器 的 DOOR_UNREF 属 性 

我 们 在 15.3 节 中 提 到 过 ，DOOR_UNREF 可 作为 一 个 新 创建 的 门 的 
属性 之 一 指定 给 door_create 芳 数 。 该 男 数 的 手册 页 面 中 说 ， 当 指 代 菏 个 
具备 该 属性 的 门 的 描述 符 数 降 为 1 ( 即 该 门 的 引用 计数 从 2 变 为 1) 时 ， 
该 门 的 服务 器 过 程 将 有 一 次 特殊 的 激活 。 特 殊 之 处 在 于 ， 传 递 给 该 服 


务 器 过 程 的 第 二 个 参数 (指向 数据 参数 的 指针 ) 是 常 值 
DOOR_UNREF_DATA ° 下面 列 出 了 引用 该 门 的 三 种 方法 。 

(1) 服 务 器 中 由 door_create 返 回 的 描述 符 算 作 一 个 引用 。 事 实 上 ， 激 
活 某 个 不 再 引用 过 程 的 触发 条 件 是 其 引用 计数 从 2 变 为 1 而 不 是 从 1 变 为 
0 的 原因 在 于 ， 服 务 需 进程 通常 在 其 整个 存活 期 内 一 直 保持 该 措 述 符 打 
开 o 

(2) 附 接 到 该 门 上 的 文件 系统 中 的 路 径 名 也 算 作 一 个 引用 。 我 们 可 
以 删除 这 个 引用 ， 办 法 有 : 调用 fdetach 函 数 ， 运 行 fdetach 程 序 ， 或 者 从 
文件 系统 中 删除 该 路 径 名 ( 既 可 调用 unlink 函 数 ， 也 可 运行 [rm 命令 ) 。 

(3) 客 户 中 由 open 返 回 的 描述 符 算 作 一 个 打开 的 引用 ， 直 到 该 描述 
符 关 闭 为 止 ， 这 种 关闭 既 可 以 显 式 地 调用 close 完 成 ， 也 可 以 隐 式 地 由 
客户 进程 的 终止 完成 。 本 章 中 已 给 出 的 所 有 客户 进程 都 是 隐 式 地 关闭 
门 摘 述 符 的 。 

我 们 的 第 一 个 例子 展示 ， 如 有 果 服 务 器 在 调用 fattch 之 后 关闭 所 创建 
的 门 描述 符 ， 那 么 其 服务 器 过 程 的 不 再 引用 激活 (unreferenced 
invocation) 将 立即 发 生 。 图 15-16 给 出 了 我 们 的 服务 器 过 程 和 服务 器 
main KR ° 

7~10 服务 器 过 程 认 出 特殊 的 不 再 引用 激活 后 输出 一 个 消息 。 当 前 
线程 通过 以 两 个 空 指针 和 两 个 值 为 0 的 大 小 调用 door retum 从 这 个 特殊 
调用 中 返回 。 

28 fattach 返 回 后 close 所 创建 的 门 描述 符 。fattach 之 后 该 描述 符 对 于 
服务 器 的 唯一 用 途 是 供 调 用 door_bind、door_info 或 door_revoke 之 用 。 

启动 该 服务 器 ， 我 们 注意 到 不 再 引用 激活 立即 发 生 : 


solaris 96 serverunref1 /tmp/door1 


door unreferenced 
奶 踩 该 门 的 引用 计数 变化 情况 ， 它 在 door_create 返 回 后 变 为 1， 在 
fattach 返 回 后 变 为 2。 服 务 器 调用 close 使 它 从 2 变 为 1， 于 是 触发 了 不 再 


引用 激活 。 该 门 现在 所 剩 的 唯一 引用 是 它 在 文件 系统 中 的 路 径 名 ， 它 
是 客户 指 代 该 门 所 需 的 手段 。 这 就 是 说 ， 客 户 仍 能 正常 工作 。 

solaris 96 clientunref1 /tmp/door1 11 

result: 121 

solaris 96 clientunref1 /tmp/door1 22 

result: 484 


doors/serverunrefl1.c 


18 


#include "unpipc.h" 
void 
servproc(void *cookie, char *dataptr, size t datasize, 
door desc t *descptr, size t ndesc) 
{ 
long arg, result; 


) 


int 


r 


printf ("door unreferenced\n" 
Door_return (NULL, 0, NULL, 0 


r 


if (dataptr == DOOR UNREF DATA) { 
) 
) 


) 


arg - *((long *) dataptr); 
printf ("thread id $1d, arg = %ld\n", pr thread id(NULL), arg); 
sleep(6); 


result - arg * arg; 
Door return((char *) &result, sizeof(result), NULL, 0); 


main(int argc, char **argv) 


{ 


int fd; 


if (argc != 2) 
err quit("usage: serverunrefl <server-pathname>") ; 


/* create a door descriptor and attach to pathname */ 
fd - Door create(servproc, NULL, DOOR UNREF); 


unlink (argv[11); 

Close(Open(argv[1], O CREAT | O RDWR, FILE MODE)); 
Fattach(fd, argv[1]); 

Close (fd); 


/* servproc() handles all client requests */ 
for Qj g 9 
pause(); 


doors/serverunref1.c 


图 15-16 处 理 不 再 引用 激活 的 服务 器 过 程 


F 


而 且 ， 该 服务 器 过 程 没 有 进一步 的 不 再 引用 激活 发 生 。 事 实 上 对 
于 一 个 给 定 门 ， 只 会 递交 一 次 不 再 引用 激活 。 

现在 把 我 们 的 服务 器 程序 改 回 平常 的 情形 ， 也 就 是 并 不 close 所 创 
建 的 门 描述 符 。 图 15-17 给 出 了 服务 器 过 程 和 服务 器 main 函 数 。 我 们 设 
置 了 6 秒 钟 的 睡眠 ， 并 在 服务 器 过 程 返回 之 前 输出 信息 。 在 一 个 窗口 中 
启动 服务 器 ， 在 另 一 个 窗口 中 验证 服务 器 所 创建 的 门 的 关联 路 径 名 存 
在 于 文件 系统 中 ， 然 后 用 rm 命令 删除 该 路 径 名 : 

solaris 96 ls -l /tmp/door2 

Drw-r--r--  1rstevens other1 0 Apr 16 08:58 /tmp/door2 

solaris 96 rm /tmp/door2 

我 们 一 删除 该 路 径 名 ， 相 应 服务 器 过 程 的 不 再 引用 激活 就 发 生 : 

solaris 96 serverunref2 /tmp/door2 

door unreferenced 一 旦 从 系统 中 删除 该 路 


但 味 该 门 的 引用 计数 变化 情况 ， 它 在 door_create 返 回 后 变 为 1， 在 
fattach 返 回 后 变 为 2。 当 我 们 rm 该 门 的 路 径 名 时 ， 这 个 命令 把 它 的 引用 
计数 从 2 降 为 1， 于 是 触发 了 不 再 引用 激活 。 

在 下 面 的 有 天 该 属性 的 最 后 一 个 例子 中 ， 我 们 仍然 从 文件 系统 
删除 路 径 名 ， 不 过 是 在 启动 门 的 三 次 客户 激活 之 后 。 我 们 要 展示 的 
是 ， 每 次 客户 激活 给 引用 计数 加 1， 只 有 所 有 三 个 客户 都 终止 后 ， 不 再 
引用 激活 才 发 生 。 我 们 使 用 先前 的 在 图 15-17 中 给 出 的 服务 器 程序 ， 客 
户 程序 没有 变动 ， 如 图 15-2 所 示 。 


doors/serverunref2.c 


1 #include "unpipc.h" 

2 void 

3 servproc(void *cookie, char *dataptr, size t datasize, 

4 door desc t *descptr, size t ndesc) 

54 

6 long arg, result; 

7 if (dataptr -- DOOR UNREF DATA) { 

8 printf ("door unreferenced\n") ; 

9 Door return(NULL, 0, NULL, 0); 

10 ) 

TE arg = *((long *) dataptr); 

12 printf ("thread id $1d, arg = %ld\n", pr thread id(NULL), arg); 
13 sleep(6); 

14 result - arg * arg; 

15 printf ("thread id $1d returning\n", pr thread id (NULL)); 
16 Door return((char *) &result, sizeof(result), NULL, 0); 
17 } 

18 int 

19 main(int argc, char **argv) 

20 ( 

21 int fd; 

22 if (argc !- 2) 

23 err quit("usage: serverunref2 <server-pathname>") ; 
24 /* create a door descriptor and attach to pathname */ 
25 fd - Door create(servproc, NULL, DOOR UNREF); 

26 unlink (argv[1]) ; 

27 Close(Open(argv[1], O CREAT | O RDWR, FILE MODE)); 

28 Fattach(fd, argv[1]); 

29 /* servproc() handles all client requests */ 

30 ton 6m. 

31 pause () ; 

32 } 


doors/serverunref2.c 


图 15-17 不 关闭 所 创建 门 描述 符 的 服务 器 程序 


solaris 96 clientunref2 /tmp/door2 44 & clientunref2 /tmp/door2 55 & \ 


clientunref2 /tmp/door2 66 & 


[2] 13552 
[3] 13553 
[4] 13554 
solaris 96 rm /tmp/door2 在 三 个 客户 运行 期 间 


solaris 96 result: 1936 


result: 3025 

result: 4356 

Rm eA as BAD B: 

solaris 96 serverunref2 /tmp/door2 

thread id 4,arg = 44 

thread id 5,arg = 55 

thread id 6,arg = 66 

thread id 4 returning 

thread id 5 returning 

thread id 6 returning 

door unreferenced 

仍 味 该 门 的 引用 计数 变化 情况 ， 它 在 door_create 返 回 后 变 为 1， 在 
fattach 返 回 后 变 为 2。 当 每 个 客户 调用 open 时 ， 引 用 计数 逐次 加 1， 从 2 

变 为 9， 从 3 变 为 4， 最 后 从 4 变 为 5。 当 我 们 rm 该 门 的 路 径 名 时 ， 引 用 计 

数 从 5 变 为 4。 然后 随 着 每 个 客户 的 终止 ， 引 用 计数 器 从 4 变 为 3， 从 3 变 
为 2， 最 后 从 2 变 为 1， 最 后 这 次 减 1 触 发 了 不 再 引用 激活 。 

以 上 这 些 例子 表明 ， 尽 管 DOOR_UNREF 属 性 的 说 明 很 简单 (“ 当 
引用 计数 从 2 变 为 1 时 ， 不 再 引用 激活 发 生 ”) ,但 是 要 使 用 这 一 特性 ， 
必须 自 先 理解 引用 计数 。 


15.8 fi vli [ee 


2425 TRES — 7 31 2T E Te FF A — P ERE A BB — P EET , 
我 们 通 单 想到 以 下 两 点 : 

调用 fork 之 后 ， 子 进程 与 父 进 程 共享 所 有 打开 着 的 描述 符 

调用 exec 之 后 ， 所 有 摘 述 符 通 利 仍 保持 打开 。 


前 一 个 例子 中 ， 父 进程 打开 一 个 搞 述 符 ， 调 用 fork 派 生出 子 进程 ， 
然后 父 进 程 关闭 该 描述 符 ， 由 子 进程 来 处 理 它 。 这 样 就 把 一 个 打开 着 
的 描述 符 从 父 进 程 传递 给 了 子 进程 。 

现今 的 Unix 系 统 扩充 了 这 种 描述 符 传 递 概念 ， 提 供 了 把 任何 打开 
着 的 接 述 符 从 一 个 进程 传递 给 任何 其 他 进程 的 能 力 ， 这 两 个 进程 间 有 
无 亲缘 天 系 少 可 。|] 提 供 了 从 客户 到 服务 句 以 及 从 服务 絮 到 客户 的 一 
个 描述 符 传递 API 。 

我 们 在 UNPv1 的 14.7 [3] 讲述 过 使 用 Unix 域 套 接 字 的 接 述 符 传 
递 。 源 目 Berkely 的 内 核 使 用 这 些 套 接 字 传递 描述 符 ，TCPv3 第 18 章 中 
提供 了 全 部 细节 。SVR4 内 核 使 用 另 一 种 技术 来 传递 描述 符 ， 即 
I SENDFD 和 I_RECVFD 这 两 个 ioctl 命令，APUE 的 15.5.1 节 讲述 了 它 
们 。 但 是 SVR4 进 程 仍 可 以 使 用 Unix 域 套 接 字 来 访问 这 一 内 核 特性 。 

注意 理解 传递 描述 符 的 含义 。 图 4-7 中 ， 服 务 器 打开 文件 后 把 整个 
文件 内 容 复 制 到 底部 的 管道 中 。 如 果 该 文件 的 大 小 为 IMB ， 那 么 通过 
底部 的 管道 从 服务 器 往 客户 流动 了 1MB 的 数据 。 然 而 如 果 是 服务 器 往 
客户 传递 回 一 个 描述 符 的 话 ， 通 过 图 4-7 中 底部 的 管道 传递 的 仅仅 是 这 
个 描述 符 《我 们 假设 它 是 某 些 特定 于 内 核 的 小 量 信息 ) ， 而 不 是 文件 
本 吴 。 客 户 取得 该 描述 符 后 读 出 文件 内 容 ， 并 把 它 写 往 标 准 输出 。 所 
有 的 文件 读 出 操作 都 发 生 在 客户 中 ， 服 务 器 只 是 打开 该 文件 。 

注意 ， 服 务 器 不 能 只 是 通过 图 4-7 中 底部 的 管道 写 出 描述 符号 ， 就 
像 以 下 代码 那样 : 

int fd; 

f..Open....); 

Write(pipefd, &fd,sizeof(int)); 

APDE o XUL ee AF RE TERE BPE * (BEd ETE 
服务 硕 中 为 4。 即 使 该 描述 符 在 客户 中 是 打开 的 ， 也 几乎 可 以 肯定 它 指 
代 的 文件 不 同 于 服务 圳 进程 中 摘 述 符 4 所 指 代 的 文件 〈 从 一 个 进程 到 另 


一 个 进程 描述 符号 意义 不 变 的 唯一 时 刻 是 穿越 fork 前 后 和 穿越 exec 前 
后 ) 。 如 果 服 务 器 中 的 最 低 未 用 描述 符 为 4， 那 么 服务 器 中 一 个 成 功 的 
open 将 返回 4。 如 采 服 务 器 把 摘 述 符 4“ 传 递 ” 给 客户 ， 而 客户 中 的 最 低 未 
用 描述 符 为 7， 那 么 我 们 希望 客户 中 的 描述 符 7 与 服务 器 中 的 描述 符 4 指 
代 同 一 个 文件 。APUE 的 图 15-4 和 TCPv3 的 图 18-4 展 示 了 从 内 核 角度 看 
来 必然 发 生 的 情况 : 这 两 个 描述 符 (这 儿 的 例子 是 服务 器 中 的 4 和 客户 
中 的 7) 必须 同时 指 癌 内 核 中 的 同一 文件 表 项 。 描 述 符 传递 涉及 一 定 的 
内 核 神秘 技巧 ， 然 而 像 门 和 Unix 域 套 接 字 这 样 的 API 隐 减 了 这 些 内 部 细 
玫 ， 从 而 允许 进程 们 很 容易 从 一 个 进程 回 另 一 个 进程 传递 描述 符 。 
通过 一 个 门 从 客户 回 服务 器 传递 描述 符 的 手段 是 ， 把 door_arg_{t 结 
构 的 desc_ptr 成 员 设 置 成 指 问 一 个 door_desc_t 结 构 的 数组 ，door_num 成 
员 则 设置 成 这 些 door_desc_t 结 构 的 数目 。 从 服务 絮 同 客户 传递 回 摘 述 
符 的 手段 是 ， 把 door_return 的 第 三 个 参数 设置 成 指 回 一 个 door_desc_{t 结 
构 的 数组 ， 把 该 函数 的 第 四 个 参数 设置 成 竺 传递 描述 符 的 数目 。 
typedef struct door desc { 


door attr t d attributes; /* tag for union */ 
union { 
struct { /* valid if tag = 
DOOR  DESCRIPTOR */ 
int d descriptor; /* descriptor number */ 
door id t d id; /* unique id */ 
) d desc; 
} d data; 


} door desc t; 
该 结构 舍 有 一 个 联合 ， 其 第 一 个 成 员 是 一 个 标识 该 联合 中 合 有 哪 
个 成 员 的 标记 。 不 过 该 联合 当前 只 定义 了 一 个 成 员 (描述 一 个 描述 符 


的 ddesc 结 构 ) ， 标 记 (dattributes ) 于 是 必须 设置 为 
DOOR DESCRIPTOR ° 

例子 

我 们 修改 以 前 的 文件 服务 器 例子 (回想 图 1-9) ， 使 服务 器 打开 文 
件 并 把 打开 着 的 描述 符 传递 给 客户 ， 然 后 由 客户 把 文件 的 内 容 复 制 到 
标准 输出 。 图 15-18 展 示 了 这 样 的 编排 。 


服务 器 
servproc( ) 
( 


door desc t desc; 


fd - open( ); 
desc... - fd 
door return(NULL, 0, &desc, 1); 


main( ) 7 
( 一 


main( ) 


door call(servfd, ); ( 


2 
filefd = arg.desc_ptr->... 
while ( (n = Read(filefd, )) > 0) 
Write(STDOUT FILENO, ); 


fd = door. create( ); 
fattach(fd, path); 


图 15-18 服务 器 传递 回 打 开 着 描述 符 的 文件 服务 器 例子 
图 15-19 给 出 了 客户 程序 。 


doors/clientfdl.c 


1 #include "unpipc.h" 
2) int 
3 main(int argc, char **argv) 
E d 
5 int door, fd; 
6 char argbuf [BUFFSIZE], resbuf[BUFFSIZE], buff [BUFFSIZE] ; 
y size t len, n; 
8 door arg t arg; 
9 if (argc !- 2) 
10 err quit("usage: clientfdl <server-pathname>") ; 
11 door = Open(argv[1], O_RDWR); /* open the door */ 
12 Fgets(argbuf, BUFFSIZE, stdin) ; /* read pathname of file to open */ 
13 len = strlen(argbuf) ; 
14 if (argbuf[len-1] == '\n') 
15 len--; /* delete newline from fgets() */ 
16 /* set up the arguments and pointer to result */ 
17 arg.data_ptr = argbuf; /* data argument */ 
18 arg.data_size = len + 1; /* size of data argument */ 
19 arg.desc_ptr = NULL; 
20 arg.desc_num = 0; 
21 arg.rbuf = resbuf; /* data results */ 
22 arg.rsize = BUFFSIZE; /* size of data results */ 
23 Door_call(door, &arg) ; /* call server procedure */ 
24 if (arg.data_size != 0) 
25 err quit("$.*s", arg.data size, arg.data ptr); 
26 else if (arg.desc ptr -- NULL) 
27 err quit("desc ptr is NULL"); 
28 else if (arg.desc num !- 1) 
29 err quit("desc num - $d", arg.desc num); 
30 else if (arg.desc ptr-»d attributes !- DOOR DESCRIPTOR) 
31 err quit("d attributes - $d", arg.desc ptr-»d attributes); 
32 fd - arg.desc ptr-»d data.d desc.d descriptor; 
33 while ( (n = Read(fd, buff, BUFFSIZE)) > 0) 
34 Write(STDOUT FILENO, buff, n); 
35 exit (0) ; 
36 } 


mil 


doors/clientfdl.c 


图 15-19 描述 符 传递 文件 服务 器 例子 的 客户 程序 


打开 门 ， 从 标准 输入 读 入 路 径 名 

9~15 与 待 打开 的 门 关联 的 路 径 名 是 一 个 命令 行 参 数 。 打 开 该 门 
从 标准 输入 读 入 客户 硕 望 打开 的 文件 名 ， 并 删 掉 结 尾 的 换行 符 。 
设置 参数 和 指向 结果 的 指针 

167-22 设置 door_arg_t 结 构 。 我 们 给 路 径 名 的 大 小 多 加 了 1， 以 允 


许 服务 器 用 空 字符 终止 该 路 径 名 。 


调用 服务 器 过 程 并 检查 结果 

23~31 调用 服务 器 过 程 ， 然 后 检查 其 结果 是 我 们 预期 的 : 没有 数 
据 ， 有 一 个 描述 符 。 我 们 不 久 将 看 到 ， 服 务 器 只 在 打 不 开 客 户 指定 的 
文件 时 才 返 回 数据 〈 含 有 一 个 出 错 消 息 ) ， 这 种 情况 下 ， 我 们 调用 
err_quit 输 出 这 个 错误 。 

获取 描述 符 ， 把 文件 复制 到 标准 输出 

32~34 从 door_desc_t 结 构 取 得 描述 符 ， 然 后 把 相应 的 文件 复制 到 
标准 输出 。 

图 15-20 给 出 了 服务 絮 过 程 。 服 务 器 main 了 范 数 没有 变化 ， 如 图 15-3 
所 示 。 


doors/serverfdl.c 


1 #include "unpipc.h" 
2 void 
3 servproc(void *cookie, char *dataptr, size t datasize, 
4 door desc t *descptr, size t ndesc) 
5 1 
6 int fd; 
F char resbuf [BUFFSIZE] ; 
8 door_desc_t desc; 
9 dataptr [datasize-1] = 0; /* null terminate */ 
10 if ( (fd - open(dataptr, O RDONLY)) -- -1) ( 
11 /* error: must tell client */ 
12 snprintf(resbuf, BUFFSIZE, "%s: can't open, %s", 
13 dataptr, strerror(errno) ) ; 
14 Door return(resbuf, strlen(resbuf), NULL, 0); 
15 ) eise ( 
16 /* open succeeded: return descriptor */ 
17 desc.d data.d desc.d descriptor - fd; 
18 desc.d attributes - DOOR DESCRIPTOR; 
19 Door return(NULL, 0, &desc, 1); 
20 ) 
21 } 


doors/serverfdl.c 


图 15-20 打开 一 个 文件 并 传递 回 其 描述 符 的 服务 器 过 程 


为 客户 打开 文件 

9~14 用 至 字符 终止 由 客户 提供 的 路 径 名 ， 然 后 答 试 open 该 文件 。 
如 有 果 发 生 错 误 ， 数 据 结果 就 是 含有 相应 出 错 消息 的 字符 吕 。 

成 功 


15~20 如 条 open 成 功 ， 那 吏 返 回 所 得 到 的 朱 述 符 ， 这 时 没有 数据 


我 们 局 动 服 务 历 ， 指 定 其 待 创建 的 门 的 路 径 名 为 /tmp/fd1， 然 后 运 
行 客 户 程 序 : 

solaris 96 clientfd1 /tmp/fd1 

/etc/shadow 

/etc/shadow: can't open,Permission denied 

solaris % clientfd1 /tmp/fd1 

/no/such/file 

/no/such/file: can't open,No such file or directory 

solaris % clientfd1 /tmp/df1 

/etc/ntp.conf 一 个 只 有 2 行文 本 的 文 
人 

multicastclient 224.0.1.1 

driftfile /etc/ntp.drift 

前 面 两 次 我 们 指定 了 导致 出 错 返 回 的 路 径 名 ， 最 后 一 次 服务 器 返 
回 了 一 个 只 合 2 行 文本 的 文件 的 描述 符 。 

通过 | 来 传递 挡 述 符 存 在 一 个 问题 。 在 我 们 的 例子 中 要 看 到 这 个 
问题 ， 只 需 在 服务 器 过 程 中 成 功 的 open 调 用 之 后 加 一 个 printf 语 句 。 你 
将 看 到 每 次 打开 的 描述 符 值 比 上 一 个 描述 符 值 大 1。 问 题 在 于 服务 器 把 
这 些 描述 符 传 递 给 客户 后 没有 关闭 它们 。 然 而 没有 位 单 的 办 法 做 到 这 
一 点 。 从 逻辑 上 讲 ， 执 行 close 的 合适 位 置 是 在 door_returm 返 回 之 后 ， 
为 那 时 所 打开 的 描述 符 已 发 送 给 客户 ， 然 而 door_retum 并 不 返回 ! 要 是 
我 们 通过 一 个 Unix 域 套 接 字 使 用 sendmsg 来 传递 该 描述 符 ， 或 者 通过 一 
个 SVR4 管 道 使 用 ioctl 来 传递 它 ， 那 么 可 以 在 sendmsg 或 ioctl 返 回 后 close 
它 。 然 而 门 鸭 描述 符 传 递 规范 不 同 于 这 两 种 技术 ， 因 为 从 传递 描述 符 
的 函数 上 不 会 有 返回 发 生 。 绕 过 这 个 问题 的 唯一 办 法 是 ， 让 服务 器 过 


程 以 某 种 方式 记 着 它 已 打开 了 一 个 描述 符 ， 并 在 以 后 某 个 时 候 关 闭 
它 ， 这 么 一 来 程序 会 变 得 非常 杂乱 。 

这 个 问题 到 Solaris 2.7 中 应 得 到 纠正 ， 办 法 是 增加 一 个 新 的 
DOOR RELEASE 属性 。 发 送 者 把 d attributes 设置 成 
DOOR DESCRIPTOR | DOOR_RELEASE， 这 样 告诉 系统 在 把 相应 的 描 
述 竺 传递 给 接收 者 之 后 要 将 其 关闭 。 


15.9 door sever create Ha 


我 们 随 图 15-9 展 示 出 ， 当 客户 请 求 到 达 时 ， 门 函数 库 会 按照 处 理 它 
们 的 需要 上 自动 地 创建 新 线程 。 这 些 线程 由 该 函数 库 作 为 脱离 的 线程 创 
建 ， 具 有 默认 的 线程 栈 大 小 ， 禁 止 了 线程 取消 功能 ， 并 具有 从 调用 
door_create 的 线程 初始 继承 来 的 信号 掩 码 和 调度 类 。 如 有 果 我 们 想 要 改变 
上 上述 任何 特性 ， 或 者 希望 亲自 管理 服务 器 线程 池 ， 那 么 可 以 调用 
door_server_create 以 指定 我 们 自己 的 服务 器 创建 过 程 (sever creation 


procedure) 。 


#include <door.h> 

typedef void Door_create_proc(door_info_t *); 

Door create proc *door server create(Door create proc *proc); 

返回 : 指向 先前 的 服务 器 创建 过 程 的 指针 

跟 15.3 节 中 door_create 的 声明 一 样 ， 我 们 使 用 C 的 typedef 语 句 来 倘 
化 库 函 数 的 函数 原型 。 我 们 的 新 数据 类 型 把 服务 器 创建 过 程 定义 为 接 
受 单个 参数 〈 指 向 一 个 door_ info t 结 构 的 指针 ) ， 不 返回 任何 值 

(void) 。 当 我 们 调用 door_server_create 时 ， 其 参数 是 指向 我 们 的 服务 

妖 创 建 过 程 的 指针 ， 返 回 值 是 指向 上 一 个 服务 右 创 建 过 程 的 指针 。 

每 当 需 要 一 个 新 线程 来 给 某 个 客户 请 求 提供 服务 时 ， 我 们 的 服务 
妖 创 建 过 程 就 被 调用 。 至 于 哪个 服务 器 过 程 需要 这 个 新 线程 的 信息 则 


存放 在 其 地 址 作为 参数 传递 进 本 创建 过 程 的 door_info_t 结 构 中 。 该 结构 
的 di_proc 成 员 含有 这 个 服务 絮 过 程 的 地 址 ，di_data 成 员 则 舍 有 该 服务 
怖 过 程 每 次 被 调用 时 所 传递 进去 的 cookie 指 针 。 

查看 所 发 生 的 活动 的 最 简单 办 法 是 使 用 例子 。 我 们 的 客户 程序 没 
有 变化 ， 如 图 15-2 所 示 。 我 们 的 服务 器 程序 中 除 原来 的 服务 器 过 程 画 数 
和 main 函 数 外 ， 增 加 了 两 个 新 函数 。 图 15-21 给 出 服务 噩 进程 中 四 个 函 
数 的 关系 概 狐 ， 当 时 一 些 函 数 已 注册 而 且 所 有 函数 都 已 调用 。 

图 15-22 给 出 了 服务 器 程序 main 函 数 。 

与 图 15-3 相 比 ， 有 四 个 变动 : (0) 去 掉 了 门 描述 符 fd 的 声明 CE 
现在 是 一 个 我 们 将 在 图 15-23 中 给 出 并 描述 的 全 局 变量 ) ; (2) 以 一 个 
互 斥 锁 保 护 door_create 调 用 〈 也 在 图 15-23 中 说 明 ) ; (3) 在 创建 门 之 
前 调用 door_server_create， 将 其 参数 指定 为 我 们 的 服务 器 创建 过 程 

(my_create， 它 将 在 下 面 给 出 ) ; (4) door_create 调 用 中 ， 最 后 一 个 
参数 (属性 ) 现在 是 DOOR_PRIVATE 而 不 是 0。DOOR_PRIVATE 告 诉 
门 函数 库 本 门将 有 它 自 己 的 称 为 私 用 服务 器 池 (private server pool) 的 
线程 池 。 

使 用 DOOR PRIVATE 指定 一 个 私 用 服务 器 池 和 使 用 
door_server_create 指 定 一 个 服务 器 创建 过 程 是 互相 独立 的 。 总 共有 以 下 
四 种 可 能 情形 。 


servproc( ) 
{ 


— 服务 器 过 程 
door return( ); 

每 个 新 线程 启动 时 o 每 个 线程 逻辑 上 显得 

执行 my_thread 到 SEDNDEOC 中 继续 


my thread( ) 执行 ， 从 而 为 每 个 客 
{ 户 调用 提供 服务 
Era 由 每 个 服务 
door bind( ); 器 线程 执行 
door return( ); 的 函数 
) 
{ 
| | Pa 服务 器 创 
pthread create( , my thread, ); 建 过 程 


} 
注册 my_create main( ) 
{ 


door, server, create (my. create); 


fd = door, create(servproc, ); 


作为 本 门 的 服务 器 过 程 注册 
servproc; 并 执行 my create ) 
以 创建 第 一 个 线程 


图 15-21 我 们 的 服务 器 进程 中 四 个 画 数 的 概貌 


doors/server6.c 


42 int 

43 main(int argc, char **argv) 

44 ( 

45 if (argc !- 2) 

46 err quit("usage: server6 <server-pathname>") ; 
47 Door server create (my create); 

48 /* create a door descriptor and attach to pathname */ 
49 Pthread mutex lock(&fdlock); 

50 fd - Door create(servproc, NULL, DOOR PRIVATE); 

51 Pthread mutex unlock (&fdlock); 

52 unlink (argv[11); 

53 Close(Open(argv[1], O CREAT | O RDWR, FILE MODE)); 
54 Fattach(fd, argv[1]); 

55 /* servproc() handles all client requests */ 
56 form qq -wy 

57 pause() ; 

58 ) 


doors/server6.c 


图 15-22 线程 池 管 理 例子 程序 的 main 范 数 


(1) 默 认 情 形 ; 没有 私 用 服务 器 池 ， 也 没有 服务 器 创建 过 程 。 系 统 
根据 需要 创建 线程 ， 它 们 都 进入 进程 范围 的 线程 池 。 

(2) 指 定 DOOR_PRIVATER， 不 过 没有 服务 器 创建 过 程 。 系 统 根据 
需要 创建 线程 ， 对 于 创建 时 没有 指定 DOOR_PRIVATE 属 性 的 门 ， 新 创 
建 的 线程 将 进入 进程 范围 的 池 ， 对 于 创建 时 指定 了 DOOR_PRIVATE 属 
性 的 门 ， 新 创建 的 线程 将 进入 该 门 的 私 用 服务 器 池 。 

(3) 没 有 私 用 服务 器 ， 但 是 指定 了 一 个 服务 器 创建 过 程 。 每 当 需 要 
一 个 新 线程 时 ， 该 服务 器 创建 过 程 束 被 调用 ， 所 创建 的 线程 都 进入 进 
程 范 围 的 线程 池 。 

(4) 指 定 DOOR_PRIVATE， 同 时 指定 了 一 个 服务 器 创建 过 程 。 每 当 
需要 一 个 新 线程 时 ， 该 服务 器 创建 过 程 就 被 调用 。 一 个 线程 创建 出 来 
后 ， 必 须 调用 door_bind 把 自己 赋 给 合适 的 私 用 服务 器 池 ， 否 则 它 将 被 
赋 给 进程 范围 的 线程 池 。 

Al 15-2328 t. T dX 1] B) PAP hf EK 2X: my create 和 my thread ° 
my_create 是 我 们 的 服务 器 创建 过 程 ， 它 把 my_thread 指 定 为 它 所 创建 的 
每 个 线程 都 要 执行 的 函数 。 


doors/server6.c 


13 pthread mutex t fdlock = PTHREAD MUTEX INITIALIZER; 


14 static int fd - -1; /* door descriptor */ 

15 void * 

16 my thread(void *arg) 

17 { 

18 int oldstate; 

19 door info t *iptr = arg; 

20 if ((Door server proc *) iptr->di_proc == servproc) { 

21 Pthread_mutex_lock (&fdlock) ; 

22 Pthread mutex unlock(&fdlock); 

23 Pthread setcancelstate (PTHREAD CANCEL DISABLE, &oldstate); 
24 Door bind(fd); 

25 Door return(NULL, 0, NULL, 0); 

26 ) else 

27 err quit("my thread: unknown function: $p", "(Door Server proc*)iptr-*di proc"); 
28 return (NULL); /* never executed */ 

29 

30 void 

31 my create(door info t *iptr) 

32 

33 pthread t tid; 

34 pthread attr t attr; 

35 Pthread attr init(&attr); 

36 Pthread attr setscope(&attr, PTHREAD SCOPE SYSTEM); 

37 Pthread attr setdetachstate(&attr, PTHREAD CREATE DETACHED); 
38 Pthread create(&tid, &attr, my thread, (void *) iptr); 

39 Pthread attr destroy(&attr); 

40 printf("my create: created server thread %ld\n", pr thread id(&tid)); 
41 } 


doors/server6.c 


图 15-23 我 们 自己 的 线程 管理 函数 


服务 器 创建 过 程 
307-41 每 当 my_create 被 调用 时 ， 我 们 就 创建 一 个 新 线程 。 但 是 在 
调用 pthread_create 前 ， 我 们 先 初 始 化 该 线程 的 属性 ， 设 置 其 竞 用 范 
(contention scope) 为 PTHREAD_SCOPE_SYSTEM， 将 它 指定 为 脱离 
的 线程 。 接 着 调用 pthread_create 创 建 该 线程 ， 它 启动 执行 的 是 
my_thread 泵 数 。 服 务 器 创建 过 程 以 及 新 线程 启动 画 数 的 参数 都 是 指 问 
竺 激活 之 门 的 door_info_t 结 构 的 指针 。 如 果 有 一 个 带 多 个 门 的 服务 器 ， 
而 且 指 定 了 一 个 服务 器 创建 过 程 ， 该 服务 器 创建 过 程 就 在 其 中 任何 一 
个 门 需要 一 个 新 线程 时 被 调用 。 该 服务 器 创建 过 程 以 及 由 它 指 定 给 


pthread_create A’) Z f JA D) ER BUX 47 KEE AS [8T A ARH 8 SEE HJ S — 2) TS 
是 : 查看 该 door_info_t 结 构 中 的 di_proc 指 针 。 

把 竞 用 范围 设置 成 PTHREAD_SCOPE_SYSTEM 意 味 着 本 线程 将 跟 
其 他 进程 中 的 线程 竞争 处 理 器 资源 的 使 用 。 与 之 相对 的 
PTHREAD_SCOPE_PROCESS 意 味 着 本 线程 只 跟 本 进程 内 的 其 他 线程 
竞争 处 理 需 资源 的 使 用 。 后 者 对 于 门 不 起 作用 ， 因 为 门 函数 库 要 求 执 
行 door_retum 的 内 核 轻 权 进程 跟 引 发 这 个 激活 请 求 的 轻 权 进程 相同 。 未 
绑 定 的 线程 (PTHREAD SCOPE PROCESS) 可 能 在 执行 服务 器 过 程 
期 间 改 变 轻 权 进程 。[4] 

要 求 作为 脱离 的 线程 来 创建 新 线程 是 为 了 防止 系统 在 该 线程 终止 
时 保存 有 关 它 的 任何 信息 ， 因 为 不 会 有 其 他 线程 对 它 调用 
pthread join ° 

线程 启动 函数 

15~20 my. _ thread 是 通过 调用 pthread_create 指 定 的 线程 启动 函数 。 
传递 给 它 的 参数 是 早 允 传递 进 my_create 函 数 的 指向 待 激活 之 门 的 
door_info_t 结 构 的 指针 。 本 进程 中 唯一 存在 的 服务 絮 过 程 是 servproc， 
因此 我 们 只 是 验证 该 参数 引用 了 这 个 过 程 。 

等 待 描述 符 变 为 有 效 

21~22 服务 器 创建 过 程 在 door_create 首 次 被 调用 时 调用 ， 目 的 是 
为 了 创建 一 个 初始 的 服务 器 线程 。 门 函数 库 中 该 调用 是 在 door_create 返 
回 前 发 出 的 。 然 而 变量 fd 要 到 door_create 返 回 后 才 含 有 有 效 的 门 描述 
Fo (这 是 一 个 鸡 与 蛋 的 问题 。) 既然 知道 my_thread 是 作为 独立 于 调 
用 door_create 的 主线 程 的 男 一 个 线程 运行 的 ， 我 们 解决 这 个 定时 间 题 的 
办 法 于 是 瓯 是 按 下 述 方式 使 用 互 斥 锁 fdlock: 主线 程 在 调用 door_create 
前 给 该 互 不 锁 上 锁 ， 在 door_create 返 回 并 往 fd 中 存 入 一 个 值 (图 15-22) 
后 给 该 互 斥 锁 解 锁 。 我 们 的 my_thread 函 数 先 是 给 该 互 斥 锁 上 锁 (也 许 
要 阻塞 到 主线 程 解 开 该 互 斥 锁 为 止 ) ， 然 后 给 它 解锁 。 我 们 也 许可 以 


增设 一 个 由 主线 程 向 它 发 送信 号 的 条 件 变 量 ， 不 过 这 儿 没 有 这 个 必 
要 ， 因 为 我 们 知道 将 发 生 的 调用 的 顺序 。 

禁止 线程 取消 功能 

23 当 使 用 pthread_create 创 建 一 个 新 的 Posix 线 程 时 ， 线 程 取消 功能 
默认 是 启用 的 。 这 种 情况 下 ， 当 某 个 客户 中 止 一 个 进展 中 的 door_call 调 
用 时 (我 们 将 在 图 15-31 中 展示 这 个 操作 ) ， 线 程 取 消 处 理 程序 (如 果 
有 的 话 ) 将 被 调用 ， 相 应 的 服务 器 过 程 所 在 线程 随后 终止 。 在 取消 功 
能 禁止 的 情况 下 (如 这 儿 将 做 的 那样 ) ， 当 某 个 客户 中 止 一 个 进展 中 
的 door_call 调 用 时 ， 相 应 的 服务 器 过 程 仍然 完成 〈 其 所 在 的 线程 未 被 终 
止 ， 不 过 来 自 door_return 的 结果 被 简单 地 丢弃 。 既然 取消 功能 启用 时 
服务 器 线程 有 可 能 被 终止 ， 而 且 服 务 器 过 程 当时 可 能 处 于 为 其 客户 执 
行 的 某 个 操作 中 〈 它 可 能 持 有 某 些 锁 或 信号 量 ) ， 因 此 门 函 数 库 (ER 
认 ) 禁止 了 由 它 创建 的 所 有 线程 的 线程 取消 功能 。 如 果 一 个 服务 器 过 
程 希望 在 某 个 客户 过 早 终止 时 被 取消 ， 那 么 它 所 在 的 线程 必须 启用 取 
消 功能 ， 并 准备 好 处 理 这 种 事件 。 

注意 ，PTHREAD_SCOPE_SYSTEM 竞 用 范围 和 脱离 状态 时 在 创建 
线程 时 作为 属性 指定 的 。 然 而 取消 模式 只 能 由 当 事 线程 本 身 在 开始 运 
行 后 设置 。 事 实 上 ， 即 使 我 们 禁止 了 取消 功能 ， 线 程 仍 能 在 任何 时 候 
随心 所 欲 地 启用 和 禁止 它 。 

把 本 线程 捆绑 到 一 个 门 

24 调用 door_bind 把 调用 线程 捆绑 到 与 某 个 门 关 联 的 私 用 服务 器 
池 ， 其 中 该 门 的 描述 符 为 该 本 数 的 参数 。 既 然 该 调用 需要 这 个 门 描述 
和 从， 于 是 我 们 让 fd 成 为 这 个 版 本 的 服务 器 程序 的 一 个 全 局 变量 。 

使 得 本 线程 对 于 客户 调用 可 用 

25 通过 以 两 个 空 指 针 和 两 个 0 长 度 为 参数 调用 door_return， 本 线程 
使 其 自身 对 于 外 来 的 门 激活 请 求 可 用 。 

图 15-24 给 出 了 服务 器 过 程 。 它 与 图 15-9 中 的 版 本 相同 。 


doors/server6.c 
1 #include "unpipc.h" 


2 void 
3 servproc(void *cookie, char *dataptr, size t datasize, 
door desc t *descptr, size t ndesc) 


aN 


5 1 

6 long arg, result; 

7 arg - *((long *) dataptr); 

8 printf ("thread id $1d, arg = %ld\n", pr thread id(NULL), arg); 
9 sleep(5); 


10 result - arg * arg; 
11 Door return((char *) &result, sizeof(result), NULL, 0); 


doors/server6.c 


图 15-24 服务 器 过 程 


为 展示 所 发 生 的 情况 ， 我 们 首先 局 动 服务 关 ; 


solaris 96 server6 /tmp/door6 


my. create: created server thread 4 

服务 器 启动 后 一 调用 door_create， 我 们 的 服务 名 创建 过 程 就 被 首次 
调用 ， 尽 管 当 时 我 们 还 没有 局 动 客 户 。 这 就 创建 了 第 一 个 线程 ， 它 将 
等 竺 第 一 个 客户 调用 请 求 。 我 们 然后 接连 运行 客户 程序 三 次 。 

solaris 96 client6 /tmp/door6 11 

result: 121 

solaris 96 client6 /tmp/door6 22 

result: 484 

solaris 96 client6 /tmp/door6 33 

result: 1089 

BAMA aA eH, Beta BSS — T VALE 2c EY TA 
个 线程 (其 线程 ID 为 5) ， 然 后 ID 为 4 的 线程 给 所 有 三 个 客户 请 求 提 供 
了 服务 。 门 函数 库 看 来 总 是 你 留 一 个 额外 的 线程 备用 。 

my. create: created server thread 5 

thread id 4,arg = 11 

thread id 4,arg = 22 


thread id 4,arg = 33 
接着 在 后 台 几 乎 同时 执行 客户 程序 三 次 : 
solaris 96 client6 /tmp/door6 44 & client6 /tmp/door6 55 & \ 


client6 /tmp/door6 66 & 
[2] 4919 
[3] 4920 
[4] 4921 


solaris 96 result: 1936 

result: 4356 

result: 3025 

查看 服务 器 的 相应 输出 ， 我 们 看 到 创建 了 两 个 新 线程 《线程 ID 分 
别 为 6 和 7) ， 给 三 个 客户 请 求 提供 服务 的 分 别 是 线程 4、5 和 6 。 

thread id 4,arg = 44 

my. create: created server thread 6 

thread id 5,arg = 66 

my. create: created server thread 7 

thread id 6,arg = 55 


15.10 door bind ` door unbind 和 door revoke Ha 
加 上 以 下 三 个 额外 函数 后 ， 门 API 束 完整 了 。 


#include <doorh> 
int door_bind(int fd); 


int door unbind(void); 


int door. revoke(int fd); 


HRE: 者 成 功 则 为 0， 大 出错 则 为 -1 


我 们 在 图 15-23 中 引入 了 door_bind 函 数 。 它 把 调用 线程 捆绑 到 与 描 
述 符 为 fd 时 门 关联 的 私 用 服务 需 池 中 。 如 采 调 用 线程 已 绑 定 在 另外 某 个 
门 上 ， 那 惑 执 行 一 个 隐 式 的 松绑 操作 。 

door_unbind 显 式 地 把 调用 线程 从 其 已 绑 定 的 门 上 松绑 。 

door_revoke 撤 销 对 于 由 fd 标识 的 门 的 访问 。 一 个 门 描述 符 只 能 
创建 它 的 进程 撤销 。 调 用 该 芳 数 时 已 在 进展 中 的 任何 门 激活 实例 仍 允 
许 正常 地 完成 。 


15.11 客户 或 服务 器 的 过 早 终止 


到 此 为 止 的 所 有 例子 都 假设 客户 和 服务 器 上 都 没有 异常 之 事 发 
生 。 我 们 现在 考虑 客户 和 服务 器 任何 一 方 出 错时 发 生 什 么 情况 。 我 们 
知道 ， 当 客户 和 服务 器 处 于 同一 个 进程 中 时 (图 15-1 中 的 本 地 过 程 调 
用 ) ， 客 户 不 必 担 心服 务 器 的 崩 浇 ， 反 之 亦 然 ， 因 为 如 果 任 何 一 方 朋 
涡 ， 那 么 整个 进程 表演 。 然 而 当 客户 和 服务 句 分 散 到 两 个 进程 上 时 ， 
我 们 必须 考虑 任何 一 方 朋 省 时 会 发 生 什 么 情况 ， 以 及 如 何 通知 对 方 这 
种 失败 。 客 户 和 服务 絮 无 论 是 在 同一 台 主 机 上 还 是 在 不 同 的 主机 上 ， 
我 们 都 得 考虑 这 些 问 题 。 

15.11.1 服务 器 的 过 早 终止 

客户 阻塞 在 door_call 调 用 中 等 得 结 采 期 间 ， 必 须知 道 服务 絮 线 程 是 
否 因 某 种 原因 而 终止 了 。 为 了 观察 所 发 生 的 情况 ， 我 们 让 服务 器 过 程 
调用 pthread_exit 以 终止 所 在 的 线程 。 这 样 仅 仅 终止 该 线程 本 有 号， 而 不 
是 终止 整个 服务 器 进程 。 图 15-25 给 出 了 服务 硕 过 程 。 


doors/serverintr1.c 


1 #include "unpipc.h" 

2 void 

3 servproc(void *cookie, char *dataptr, size t datasize, 

4 door desc t *descptr, size t ndesc) 

5 ( 

6 long arg, result; 

7 pthread exit (NULL); /* and see what happens at client */ 

8 arg - *((long *) dataptr); 

9 result - arg * arg; 
10 Door return((char *) &result, sizeof(result), NULL, 0); 
T -} 


doors/serverintr l.c 


图 15-25 被 激活 后 终止 其 自身 的 服务 器 过 程 
服务 器 程序 的 其 余部 分 没有 变化 ， 如 图 15-3 所 示 ， 客 户 程序 没有 变 
化 ， 如 图 15-2 所 示 。 
运行 客户 程序 ， 我 们 看 到 如 果 服 务 器 过 程 在 返回 前 终止 了 ， 那 么 
客户 的 door_call 将 返回 一 个 EINTR 错 误 。 


solaris 96 clientintr1 /tmp/door1 11 


door. call error: Interrupted system call 

15.11.2 door_call 系 统 调用 的 不 可 中 断 性 

door call 的 手册 页 面 警告 说 ， 该 函数 不 是 一 个 可 重新 局 动 的 系统 调 
Fle 《和 门 函 数 库 中 door_call 函 数 激 活 一 个 同名 的 系统 调用 。) 通过 把 服 
务 器 程序 修改 成 其 中 的 服务 器 过 程 在 返回 前 睡眠 6 秒 钟 ， 我 们 就 可 以 看 
到 这 种 特性 。 图 15-26 给 出 了 这 个 服务 右 过 程 。 


doors/serverintr2.c 


1 #include "unpipc.h" 

2 void 

3 servproc(void *cookie, char *dataptr, size t datasize, 

4 door desc t *descptr, size t ndesc) 

S 

6 long arg, result; 

7 sleep (6) ; /* let client catch SIGCHLD */ 
8 arg = *((long *) dataptr) ; 

9 result = arg * arg; 

10 Door return((char *) &result, sizeof(result), NULL, 0); 


doors/serverintr2.c 


图 15-26 睡眠 6 秒 钟 的 服务 器 过 程 


我 们 然后 对 图 15-2 给 出 的 客户 程序 进行 修改 ， 即 建立 一 个 
SIGCHLD 信 号 处 理 程序 ，fork 一 个 子 进程 ， 让 子 进 程 睡眠 2 秒 后 终止 。 
这 么 一 来 ， 客 户 父 进程 调用 door_call 后 约 2 秒 时 ， 该 父 进 程 捕 获 
SIGCHLD 信 号 ， 接 着 其 信号 处 理 程 序 返回 ， 从 而 中 断 door_call 系 统 调 
用 。 图 15-27 给 出 了 这 个 客户 程序 。 


doors/clientintr2.c 


1 #include "unpipc.h" 


2 void 
3 sig chld(int signo) 


5 return; /* just interrupt door call() */ 
6] 
7 int 


8 main(int argc, char **argv) 


9 { 


10 int fd; 

i long ival, oval; 

12 door arg t arg; 

13 if (argc != 3) 

14 err quit("usage: clientintr2 <server-pathname> <integer-value>") ; 
15 fd - Open(argv[1], O RDWR); /* open the door */ 

16 /* set up the arguments and pointer to result */ 

17 ival - atol(argv[2]); 

18 arg.data ptr - (char *) &ival; /* data arguments */ 
19 arg.data size - sizeof (long); /* size of data arguments */ 
20 arg.desc ptr - NULL; 

21 arg.desc num - 0; 

22 arg.rbuf - (char *) &oval; /* data results */ 

23 arg.rsize - sizeof (long); /* size of data results */ 
24 Signal (SIGCHLD, sig chld); 

25 if (Fork() -- 0) ( 

26 sleep (2); /* child */ 

27 exit(0); /* generates SIGCHLD */ 

28 ) 

29 /* parent: call server procedure and print result */ 
30 Door call(fd, &arg); 

31 printf("result: %ld\n", oval); 

32 exit(0); 

33 |} 


doors/clientintr2.c 


图 15-27 2 秒 钟 后 捕获 SIGCHLD 信 号 的 客户 程序 


客 己 看 到 的 错误 环 像 服务 器 过 程 过 早 地 终止 一 样 ， 都 是 EINTR。 


solaris % clientintr2 /tmp/door2 22 


door. call error: Interrupted system call 

这 意味 着 我 们 必须 阻塞 调用 door_call 期 间 可 能 产生 的 任何 信号 ， 防 
止 它们 被 递交 给 进程 ， 因 为 这 些 信和 号 会 中 呆 dqoor_call 。 

15.11.3 等 势 过 程 与 非 等 势 过 程 

要 是 我 们 知道 刚刚 捕获 了 一 个 信号 ， 当 检测 到 由 door_call 返 回 的 
EINTR 错 误 后 接着 再 次 调用 同一 个 服务 器 过 程 ， 情 况 会 怎么 样 呢 ? 这 
么 做 时 我 们 知道 错误 来 目 被 捕获 的 信号 ， 而 不 是 来 目 服务 絮 过 程 的 过 
早 终 止 。 然 而 这 么 做 会 导致 我 们 将 马上 看 到 的 问题 。 

首先 把 服务 器 过 程 修 改 为 (1) 当 被 调用 时 输出 当前 线程 ID; 

(2) 睡眠 6 秒 ;，(3) 在 返回 之 前 输出 当前 线程 ID。 图 15-28 给 出 了 这 

个 版 本 的 服务 句 过 程 。 


doors/serverintr3.c 


1 #include "unpipc.h" 


2 void 


3 servproc(void *cookie, char *dataptr, size t datasize, 


door desc t *descptr, size t ndesc) 


long arg, result; 


printf ("thread id $1d called\n", pr thread id (NULL)); 
sleep(6); /* let client catch SIGCHLD */ 
arg - *((long *) dataptr); 

result - arg * arg; 

printf ("thread id $1d returning\n", pr thread id (NULL)); 
Door return((char *) &result, sizeof(result), NULL, 0); 


doors/serverintr3.c 


图 15-28 当 被 调用 时 和 准备 返回 时 输出 当前 线程 ID 的 服务 器 过 程 


图 15-29 给 出 了 我 们 的 客户 程序 。 

2~8 声明 全 局 变量 caught_sigchld， 它 在 SIGCHLD 信 和 号 被 捕获 时 由 
其 信号 处 理 程序 设置 为 1。 

31-42 只 要 返回 的 错误 是 EINTR， 而 且 这 是 由 我 们 的 信号 处 理 程 
序 导 臻 的， 我 们 就 在 一 个 循环 中 调用 door_call 。 

如 采 只 看 客户 的 输出 ， 那 么 似乎 没有 问题 : 


solaris % clientintr3 /tmp/door3 33 


calling door call 

calling door call 

result: 1089 

一 次 调用 door_call 后 约 2 秒 时 ， 我 们 的 信号 处 理 程 序 激 活 ， 把 

caught_sigchld 设 置 为 1， 该 信号 处 理 程序 的 返回 导致 第 一 次 door_call 调 
用 返回 EINTR 销 误 ， 我 们 于 是 再 次 调用 door_call。 第 二 次 调用 时 服务 器 
过 程 运 行 到 完毕 ， 从 而 返回 预期 的 结果 。 

但 是 查看 服务 絮 的 输出 ， 我 们 发 现 服务 絮 过 程 调 用 了 两 次 : 

solaris % serverintr3 /tmp/door3 

thread id 4 called 

thread id 4 returning 

thread id 5 called 

thread id 5 returning 

客户 的 第 一 次 door_call 调 用 被 所 捕获 的 信号 中 断后 ， 它 的 第 二 次 
door_call 调 用 局 动 了 再 次 调用 服务 璐 过 程 的 另 一 个 线程 。 如 条 该 服务 促 
We SAA (idempotent) ， 那 是 没有 问题 。 但 是 如 果 该 服务 器 过 程 
是 非 等 势 的 ， 那 束 有 问题 了 。 


等 势 (idempotent) 一 词 在 用 于 描述 一 个 过 程 时 ， 意 思 是 该 过 程 可 
调用 任意 多 次 而 不 出 问题 。 我 们 那个 计算 平方 值 的 服务 器 过 程 是 等 势 
HJ: 不 论调 用 一 次 还 是 两 次 ， 我 们 都 得 到 正确 的 结果 。 另 外 一 个 等 劳 
过 程 的 例子 是 返回 当前 时 间 和 日 期 的 过 程 。 尽 管 该 过 程 每 次 可 能 返回 
不 同 的 信息 ( 壁 如 说 它 被 调用 了 两 次 ,彼此 相差 1 秒 ， 于 是 导致 返回 时 
间 也 相差 1 秒 ) ， 不 过 仍然 是 正确 的 。 非 等 势 过 程 的 经 典 例 子 是 从 某 个 
银行 账户 减 去 一 笔 费 用 的 过 程 : 除非 该 过 程 只 调用 了 一 次 ， 否 则 最 终 
结果 是 错误 的 。 


FH 
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1 include "unpipc.h" 


2 volatile sig atomic t caught sigchld; 


3 void 

4 sig chld(int signo) 

5 { 

6 caught_sigchld = 1; 

7 return; /* just interrupt door_call() */ 
8 } 

9 int 

10 main(int argc, char **argv) 

11 { 

12 int fd, rc; 

13 long ival, oval; 

14 door arg t arg; 

15 if (argc != 3) 

16 err quit ("usage: clientintr3 <server-pathname> <integer-value>") ; 
17 fd = Open(argv[1], O RDWR); /* open the door */ 

18 /* set up the arguments and pointer to result */ 

19 ival = atol(argv[2]); 

20 arg.data ptr - (char *) &ival; /* data arguments */ 
21 arg.data size = sizeof (long); /* size of data arguments */ 
22 arg.desc ptr - NULL; 

23 arg.desc num - 0; 

24 arg.rbuf - (char *) &oval; /* data results */ 

25 arg.rsize - sizeof (long); /* size of data results */ 
26 Signal (SIGCHLD, sig chld); 

27 if (Fork() == 0) ( 

28 sleep (2) ; /* child */ 

29 exit (0); /* generates SIGCHLD */ 

30 } 

31 /* parent: call server procedure and print result */ 
32 for ( za) { 

EE printf ("calling door calli"); 

34 if ( (rc = door call(fd, &arg)) == 0) 

35 break; /* success */ 

36 if (errno == EINTR && caught sigchld) { 

37 caught sigchld - 0; 

38 continue; /* call door call() again */ 
39 ) 

40 err sys("door call error"); 

41 ) 

42 printf("result: $1dWMn", oval); 

43 exit (0); 

44 ) 
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图 15-29 接收 到 EINTR 错 误 后 


15.11.4 客户 的 过 早 终止 


了 次 调用 door_call 的 客户 程序 


doors/clientintr3.c 


现在 看 一 看 客户 在 调用 door_call 之 后 但 在 服务 器 返回 之 前 终止 时 ， 
服务 器 过 程 是 如 何 得 到 通知 的 。 图 15-30 给 出 了 我 们 的 客户 程序 。 


doors/clientintr4.c 


1 #include "unpipc.h" 

2 Int 

3 main(int argc, char **argv) 

& d 

5 int fd; 

6 long ival, oval; 

7 door arg t arg; 

8 if (argc != 3) 

9 err quit("usage: clientintr4 «server-pathname» <integer-value>") ; 
10 fd - Open(argv[1], O RDWR); /* open the door */ 

11 /* set up the arguments and pointer to result */ 

12 ival - atol(argv[2]); 

13 arg.data ptr - (char *) &ival; /* data arguments */ 
14 arg.data size = sizeof (long); /* size of data arguments */ 
15 arg.desc ptr - NULL; 

16 arg.desc num - 0; 

17 arg.rbuf - (char *) &oval; /* data results */ 

18 arg.rsize - sizeof (long); /* size of data results */ 
19 /* call server procedure and print result */ 

20 alarm(3); 

21 Door call(fd, &arg); 

22 printf("result: %ld\n", oval); 

23 exit (0); 

24 ) 


doors/clientintr4.c 


图 15-30 调用 door_call 后 过 早 终止 的 客户 程序 


20 与 图 15-2 相 比 唯一 的 变化 是 ， 在 调用 door_call 之 紧 前 调用 
alarm(3)。 该 贺 数 调度 了 一 个 3 秒 后 发 出 的 SIGALAM 信 号 ， 但 是 由 于 我 
们 没有 捕获 这 个 信号 ， 因 此 它 的 默认 行为 是 终止 客户 进程 。 这 将 导致 
客户 在 door_call 返 回 前 终止 ， 因 为 我 们 将 在 服务 絮 过 程 中 放置 一 个 6 秒 
钟 的 睡眠 。 

图 15-31 给 出 了 我 们 的 服务 器 过 程 以 及 它 的 线程 取消 处 理 程序 。 

回想 8.5 市 中 就 线程 取消 功能 的 讨论 以 及 随 图 15-23 进 行 的 相关 讨 
论 。 当 系统 检测 到 客户 在 其 door_call 调 用 仍然 进展 期 间 即 将 终止 时 ， 残 
向 处 理 该 调用 的 服务 器 线程 发 送 一 个 取消 请 求 。 


如 宁 该 服务 圳 线程 禁止 了 取消 功能 ， 那 瓯 什么 事情 都 不 发 生 ， 该 
线程 继续 执行 到 完毕 (调用 door_return 之 时 ) ， 结 果 则 被 丢弃 。 

如 果 该 服务 絮 线 程 局 用 了 取消 功能 ， 那 就 调用 所 设置 的 任何 清理 
处 理 程序 ， 该 线程 随后 终止 。 

fr B 15-31 25 E By HR $$ woe, dX d] BW H 
pthread setcancelstate JA H Ez BUB DHE, AAT] Nae G1 E 2 
IAE (LIAS BE 9 AKRON AP 5 oldstate P (RF 24 Bil JG As, DAS 
在 本 函数 尾 恢复 状态 。 我 们 然后 调用 pthread_cleanup_push 以 把 函数 
servproc_cleanup 注 册 为 取消 处 理 程序 。 该 贸 数 只 是 输出 本 线程 已 被 取 
消 的 消息 ， 不 过 这 儿 正 是 其 服务 器 过 程 在 客户 过 早 终止 后 做 必要 的 清 
理工 作 ( 壁 如 说 释放 互 不 锁 、 写 一 个 日 志文 件 记 录 ， 等 等 ) 的 地 方 。 
当 清 理 处 理 程序 返回 时 ， 本 线程 即 终止 。 

我 们 还 在 服务 器 过 程 中 放置 了 一 个 6 秒 钟 的 睡眠 ， 以 允许 客户 在 其 
door_call 调 用 仍 在 进展 期 间 中 止 。 
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1 #include "unpipc.h" 

2 void 

3 servproc cleanup(void *arg) 

4 { 

5 printf("servproc cancelled, thread id %ld\n", pr thread id (NULL) ) ; 
6 } 

7 void 

8 servproc(void *cookie, char *dataptr, size t datasize, 

9 door desc t *descptr, size t ndesc) 

10 ( 

s int oldstate, junk; 

12 long arg, result; 

13 Pthread setcancelstate(PTHREAD CANCEL ENABLE, &oldstate); 
14 pthread cleanup push(servproc cleanup, NULL); 

15 sleep(6); 

16 arg - *((long *) dataptr); 

17 result - arg * arg; 

18 pthread cleanup pop(0); 

19 Pthread setcancelstate(oldstate, &junk); 

20 Door return((char *) &result, sizeof(result), NULL, 0); 
21 } 


doors/serverintr4.c 


图 15-31 检测 客户 过 早 终止 的 服务 器 过 程 


运行 客户 程序 两 次 ， 我 们 看 到 当 它 们 的 进程 被 SIGALRM 信 和 号 所 杀 
KET, shell# ii f *Alarm Clock 〈 报 警 时 钟 ) ?消息 。 

solaris 96 clientintr4 /tmp/door4 44 

Alarm Clock 

solaris 96 clientintr4 /tmp/door4 44 

Alarm Clock 
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改线 程 确 实 被 取消 ， 清 理 处 理 程序 也 被 调用 。 


solaris % serverintr4 /tmp/door4 


servproc canceled,thread id 4 

servproc canceled,thread id 5 

我 们 运行 客户 程序 两 次 是 为 了 展示 ， 当 ID 为 4 的 线程 被 取消 后 ， 门 
函数 库 创 建 了 一 个 新 线程 来 处 理 客户 的 第 二 个 服务 响 过 程 激 活 请 求 。 


15.12 小 结 


门 提供 了 调用 同一 台 主 机 上 为 一 个 进程 中 某 个 过 程 的 能 力 。 下 一 
章 中 我 们 将 对 这 种 远程 过 程 调 用 概念 加 以 扩展 ， 讲 述 如 何 调用 另 一 台 
主机 上 另 一 个 进程 中 的 某 个 过 程 。 

基本 的 API 函 数 比较 简单 。 服 务 器 调用 door_create 创 建 一 个 门 ， 并 
给 它 天 联 一 个 服务 器 过 程 ， 然 后 调用 fattach 给 该 门 附 接 一 个 文件 系统 
的 路 径 名 。 客户 对 该 路 径 名 调用 open， 然 后 调用 door_call 以 调用 服务 器 
进程 中 的 服务 器 过 程 。 该 服务 右 过 程 通过 调用 door_return 返 回 。 

通常 情况 下 ， 对 一 个 门 所 执行 的 唯一 权限 测试 是 由 open 函 数 在 打 
开 该 门 时 进行 的 ， 这 种 测试 基于 客户 的 用 户 ID 和 组 ID 以 及 该 门 的 路 径 
名 的 权限 位 和 属 主 / 属 组 ID。1] 具 有 本 书 介绍 的 其 他 IPC 形 式 所 不 具备 
的 一 个 精妙 特性 ， 即 服务 颖 具有 确定 客户 的 凭证 的 能 力 ， 这 些 任 证 包 


括 客 户 的 有 效用 户 ID 和 实际 用 户 ID 以 及 有 效 组 ID 和 实际 组 ID。 服 务 器 
可 使 用 这 些 信息 来 确定 自己 是 否 想 给 相应 客户 的 请 求 提 供 服 务 。 

门 允 许 从 客户 向 服务 器 以 及 从 服务 器 同 客 户 传 递 撒 述 符 。 这 是 一 
个 非常 有 用 的 技巧 ， 因 为 Unix 中 描述 符 代 表 着 许多 访问 手段 : 访问 文 
件 以 进行 文件 或 设备 IO ， 访 问 套 接 字 或 XTI 以 进行 网 络 通 信 
(UNPv1) ， 访 问 门 以 进行 远程 过 程 调 用 。 

调用 另 一 个 进程 中 的 过 程 时 ， 我 们 必须 考虑 对 端的 过 早 终止 ， 这 
是 本 地 过 程 调 用 所 不 必 担 心 的 问题 。 如 有 果 门 服务 器 线程 过 时 终止， 其 
客户 通过 由 door_call 返 回 一 个 EINTR 错 误 得 以 通知 。 如 果 门 客户 在 其 
door_call 调 用 仍 在 进展 期 间 终 止 ， 其 服务 器 线程 就 通过 接收 一 个 线程 取 
消 请 求 得 到 通知 。 该 服务 器 线程 必须 确定 是 否 处 理 这 个 取消 请 求 。 


习题 


15.1 由 door_call 作 为 参数 从 客户 传递 给 服务 器 的 信息 有 多 少 字 

15.2 在 图 15-6 中 ， 有 必要 下 和 完 调 用 fstat 以 验证 所 打开 的 描述 符 
个 门 吗 ? 去 掉 这 个 调用 ， 看 一 看 发 生 了 什么 。 

15.3 Solaris 2.6 中 sleep(3C) 的 手册 页 面 这 么 陈述 : “The current 
process is suspended from exection. (当前 进程 从 执行 状态 挂 起 。) ”在 图 
15-9 中 ， 既 然 这 句 话 意味 着 一 旦 有 一 个 线程 调用 sleep ， 整 个 服务 器 进 
程 即 阻塞 ， 那 么 为 什么 在 第 一 个 线程 (ID 为 4) 开始 运行 后 ， 门 函数 库 
仍 能 创建 第 二 个 和 第 三 个 线程 (ID 为 5 和 6) WE? 

15.4 在 15.3 节 中 我 们 说 过 ， 对 于 使 用 door_create 创 建 的 描述 人 符 ， 它 
们 的 FD_CLOEXEC 位 十 目 动 设置 的 。 然 而 我 们 可 以 在 door_create 返 回 
后 ， 调 用 fentl 把 该 位 天 掉 。 如 果 我 们 这 么 做 后 调用 exec， 再 从 菜 个 客户 
中 激活 服务 器 过 程 ， 将 发 生 什么 ? 
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15.5 在 图 15-28 和 图 15-29 中 ， 将 客户 程序 和 服务 器 程序 各 自 的 两 个 
printf 调 用 改 为 输出 当前 时 间 。 运 行 这 两 个 程序 。 为 什么 第 一 次 激活 服 
务 絮 过程 在 2 秒 后 返回 ? 

15.6 把 图 15-22 和 图 15-23 中 保护 fd 的 互 不 锁 去 挤 ， 验 证 程序 不 再 正 
确 工 作 。 你 看 到 了 什么 错误 ? 

15.7 如 采 我 们 想 要 改变 的 唯一 的 服务 器 线程 特性 是 启用 取消 ， 那 
么 需要 建立 一 个 服务 器 创建 过 程 吗 ? 

15.8 验证 door_revoke 人 允许 已 在 进行 的 客户 调用 继续 完成 ， 并 确定 
服务 絮 过 程 被 取消 后 door_call 的 执行 情况 。 

15.9 在 上 一 道 习 题 的 解答 以 及 图 15-22 中 我 们 说 过 ， 当 服务 器 过 程 
或 服务 器 创建 过 程 需 使 用 门 描述 符 时 ， 它 必须 是 一 个 全 局 变量 。 这 种 
说 法 并 不 正确 。 重 新 编写 上 一 道 习 题解 答 的 程序 ， 让 fd 作为 main 函 数 中 
的 一 个 目 动 变量 。 

15.10 在 图 15-23 中 ， 我 们 每 次 创建 一 个 线程 都 得 调用 
pthread_attr_init 和 pthread_attr_destroy。 这 样 做 是 最 佳 的 吗 ? 
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16.1 概述 


构筑 一 个 应 用 程序 时 ， 我 们 首先 在 以 下 两 者 之 间作 出 选择 : 

(1) 构 筑 一 个 庞大 的 单一 程序 ， 完 成 全 部 工作 ; 

(2) 把 整个 应 用 程序 散布 到 彼此 通信 的 多 个 进程 中 。 

如 琳 我 们 选择 后 者 ， 接 下 去 的 择 决 是 : 

2a) 假 设 所 有 进程 运行 在 同一 台 主 机 上 (允许 IPC 用 于 这 些 进程 间 的 
E 
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2b) 假 设 某 些 进程 会 运行 在 其 他 主机 上 (要 求 使 用 进程 间 某 种 形式 
的 网 络 通信 ) 。 

在 图 15-1 中 ， 顶 部 的 情形 是 选择 1， 中 部 的 情形 是 选择 2a， 底 部 的 
情形 是 选择 2bp。 本 书 的 大 部 分 关注 的 是 2a 这 种 情况 ， 也 就 是 使 用 消息 
传递 、 共 享 内 存 区 ， 并 可 能 使 用 某 种 形式 的 同步 来 进行 同一 台 主 机 上 
的 进程 间 IPC。 同 一 进程 内 不 同 线程 间 的 IPC 以 及 不 同 进程 内 各 个 线程 
间 的 IPC 只 是 这 种 情形 的 特殊 情况 。 

不 同 部 分 之 间 需 要 网 络 通信 的 应 用 程序 大 多 数 是 使 用 显 式 网 络 编 
程 (explicit network programming) 方式 编写 的 ， 也 就 是 如 UNPvl 中 讲 
述 的 那样 直接 调用 套 接 字 API 或 XTI API。 使 用 套 接 字 API 时 ， 客 户 调用 
socket 、connect、read 和 write， 服 务 器 则 调用 socket、bind、1listen ^ 
accept、read 和 write。 我 们 熟悉 的 大 多 数 应 用 程序 (Web| Ui, ak ^ Web 
服务 器 、Telnet 客 户 、Telnet 服 务 器 等 程序 ) 就 是 以 这 种 方式 编写 的 。 

编写 分 布 式 应 用 程序 的 另 一 种 方式 是 使 用 隐 式 网 络 编程 (implicit 
network programming) 。 远 程 过 程 调 用 (RPC) 提供 了 这 样 的 一 个 工 
具 。 我 们 使 用 早已 熟悉 的 过 程 调 用 来 编写 应 用 程序 ， 但 是 调用 进程 

(客户 ) 和 含有 被 调用 过 程 的 进程 (服务器) 可 在 不 同 的 主机 上 执 
行 。 客 户 和 服务 需 运 行 在 不 同 的 主机 上 而 且 过 程 调用 中 涉及 网 络 IO， 
这 样 的 事实 对 于 程序 员 基 本 上 是 透明 的 。 事 实 上 衡量 一 个 RPC 软 件 包 
的 测度 之 一 就 是 它 能 使 作为 底层 文 撑 的 网 络 VO 对 程序 员 的 透明 度 有 多 
大 o 

16.1.1 例子 

作为 RPC 的 一 个 例子 ， 我 们 把 图 15-2 和 图 15-3 重 新 编写 成 改 用 Sun 
RPC 人 代替 门 。 客 户 以 一 个 长 整数 调用 服务 右 的 过 程 ， 返 回 值 则 是 该 值 
的 平方 。 图 16-1 给 出 了 我 们 的 第 一 个 文件 square.x。 

其 名 字 以 .x 结尾 的 文件 称 为 RPC 说 明 书 文件 (RPC specification 
file) ， 它 们 定义 了 服务 器 过 程 以 及 这 些 过 程 的 参数 和 结果 。 


定义 参数 和 返回 值 
1~6 定义 两 个 结构 ， 一 个 用 于 参数 (其 成 员 为 单个 long 变 量 ) 
男 一 个 用 于 结果 (其 成 员 为 单个 long 变 量 ) 。 


sunrpc/square1/square.x 


1 struct square in { /* input (argument) */ 
2 long argl; 
3 
4 struct square out { /* output (result) */ 
5 long resl; 
6 }; 
7 program SQUARE PROG { 
8 version SQUARE VERS { 
9 Square out SQUAREPROC(square . in) = 1; /* procedure number - 1 */ 
10 } = 1; /* version number */ 
11 } = 0x31230000; /* program number */ 
sunrpc/squarel/square.x 
图 16-1 RPC 说 明 书 文件 
U à 
定义 程序 、 版 本 和 过 程 


7~11 定义 一 个 名 为 SQUARE_PROG 的 RPC 程 序 ， 它 由 一 个 版 本 
(SQUARE VERS) 构成 ， Nc Md c a Y 

的 过 程 。 该 过 程 的 参数 是 一 个 square_in 结 构 ， 其 返回 值 则 是 一 
square_out 结 构 。 我 们 还 给 该 过 程 赋 了 一 个 值 为 1 的 过 程 号 ， ma 
的 值 为 1， 给 程序 号 赋 的 是 一 个 32 位 十 六 进 制 值 (我 们 将 在 图 16-9 中 详 
细 讨 论 程序 号 ) 。 

我 们 使 用 一 个 随 Sun RPC 软 件 包 提供 的 程序 来 编译 这 个 说 明 书 文 
件 ， 该 程序 就 是 rpc_gen 。 

我 们 编写 的 下 一 个 程序 是 调用 我 们 的 远程 过 程 的 客户 程序 main 函 
数 。 岁 16-2 给 出 了 该 函数 。 


sunrpc/squarel/client.c 


1 #include "unpipc.h" /* our header */ 
2 #include "Square.h" /* generated by rpcgen */ 
3 unt 


4 main(int argc, char **argv) 


6 CLIENT *cl; 

7 square in in; 

8 Square out *outp; 

9 if (arge ds .3) 
10 err quit("usage: client «hostname» «integer-value»"); 
11 cl = Clnt create(argv[1], SQUARE PROG, SQUARE VERS, "tcp"); 
12 in.argl = atol(argv[2]); 
13 if ( (outp = squareproc_1(&in, cl)) == NULL) 
14 err quit("$s", clnt sperror(cl, argv[1])); 
15 printf("result: $1dWMn", outp-»res1); 
16 exit (0); 

ay 


sunrpc/squarel/client.c 


图 16-2 调用 远程 过 程 的 客户 程序 main 函 数 

包括 进 由 rpcgen 生 成 的 头 文件 

2 stincludeEirpcgen/^ Æ Jsquare.h3- XF © 

声明 客户 句柄 

6 我 们 声明 一 个 名 为 cl 的 客户 句柄 (client handle) 。 客 户 句柄 意图 


看 起 来 像 标 准 1O 的 FILE 指 针 (因而 有 全 为 大 写 的 名 字 CLIENT) ° 


we 


获取 客户 句柄 
11 我 们 调用 dlnt_create， 它 运行 成 功 时 返回 一 个 客户 句柄 。 
#include <rpc/rpc.h> 
CLIENT *clnt_create(const char *host,unsigned long program, 
unsigned long versnum,const char *protocol); 
返回 : a TAM PS eR A, Æ eM 
NULL 

与 标准 WO 的 FILE 指 针 一 样 ， 我 们 并 不 关心 客户 句柄 指 癌 什么 内 
。 它 可 能 是 由 RPC 运 行 时 系统 维护 的 某 个 信息 结构 。clnt_create 分 配 


一 个 这 样 的 结构 ， 并 返回 指 回 它 的 指针 ， 以 后 每 次 调用 一 个 远程 过 程 
时， 我 们 就 把 该 指针 传递 给 RPC 运 行 时 系统 。 

clnt_create 的 第 一 个 参数 既 可 以 是 运行 我 们 的 服务 器 的 主机 的 主机 
名 ， 也 可 以 是 它 的 人 PP 地址。 第 二 个 参数 是 程序 名 ， 第 三 个 参数 是 版 本 
号 ， 这 两 者 都 来 自我 们 的 square.x 文 件 (图 16-1) 。 最 后 一 个 参数 是 我 
们 的 协议 选择 ， 通 常 指定 为 TCP 或 UDP 。 

调用 远程 过 程 并 输出 结果 

12~15 调用 我 们 的 远程 过 程 ， 其 中 第 一 个 参数 是 指向 输入 结构 的 
指针 (&in) ， 第 二 个 参数 是 所 获取 的 客户 句柄 。 〈 在 大 多 数 标准 IO 
调用 中 ，FILE 人 句柄 是 最 后 一 个 参数 。 类 似 地 ， RPC 函 数 的 最 后 一 个 参 
数 通常 为 CLIENT 句柄 。) 返回 值 是 指向 结果 结构 的 指针 。 注 意 ， 我 们 
给 输入 结构 分 配 了 空间 ， 但 是 结果 结构 是 由 RPC 运 行 时 系统 分 配 的 。 

在 square.x 说 明 书 文件 中 ， 我 们 称 远程 过 程 为 SQUAREPROC,， 但 
是 在 客户 程序 中 ， 我 们 称 它 为 squareproc_1° 这 儿 的 约定 是 : .x 文件 中 
的 名 字 转 换 成 小 写字 和 母 形式 ， 添 上 一 个 压 划 线 后 跟 以 版 本 号 。 

在 服务 器 方 ， 我 们 只 编写 服务 器 过 程 ， 如 图 16-3 所 示 。 服 务 器 程序 
的 main 函 数 由 rpc_gen 程 序 上 自动 生成 。 


sunrpc/square l/server.c 


1 #include "unpipc.h" 
2 #include "square.h" 


3 square out * 
4 squareproc 1 svcí(square in *inp, struct svc req *rqstp) 
static square out out; 


out.resl = inp-»argl * inp-»argl; 
return(&out); 


sunrpc/squarel/server.c 


图 16-3 使 用 Sun RPC 调 用 的 服务 器 过 程 


3 一 4 我 们 首先 注意 到 服务 器 过 程 的 名 字 在 版 本 号 后 添加 了 _svc。 
这 样 允许 square.h 头 文件 中 有 两 个 ANSI C 函 数 原 型 ， 一 个 是 图 16-2 中 由 
客户 调用 的 函数 〈 它 的 一 个 参数 是 客户 句柄 ) ， 另 一 个 是 实际 的 服务 
器 函数 〈 它 使 用 的 参数 与 由 客户 调用 的 函数 不 一 样 ) 。 

当 我 们 的 服务 器 过 程 被 调用 时 ， 传 递 给 它 的 第 一 个 参数 是 指 回 输 
入 结构 的 指针 ， 第 二 个 参数 是 指向 由 RPC 运 行 时 系统 传递 的 一 个 结构 
的 指针 ， 该 结构 含有 关于 这 次 激活 的 信息 (我 们 这 个 简单 的 过 程 忽略 
了 这 些 信息 ) 。 

执行 并 返回 

6~8 取出 输入 参数 并 计算 其 平方 值 。 该 结果 存放 在 一 个 结构 中 ， 
而 该 结构 的 地 址 则 作为 本 函数 的 返回 值 。 由 于 我 们 是 在 从 函数 中 返回 
一 个 变量 的 地 址 ， 因 为 该 变量 不 能 是 一 个 目 动 变 量 。 我 们 把 它 声明 为 
static 变 量 。 

机 敏 的 读者 将 注意 到 ， 这 样 做 妨碍 服务 器 函数 成 为 线程 安全 画 
数 。 我 们 将 在 16.2 节 中 讨论 这 一 点 ， 并 给 出 一 个 线程 安全 的 版 本 。 

现在 在 Solaris 下 编译 我 们 的 客户 程序 ， 在 BSD/OS 下 编译 我 们 的 服 
务 絮 程序 ， 启 动 服务 器 ， 然 后 运行 客户 程序 : 

solaris % client bsdi 11 

result: 121 

solaris % client 209.75.135.35 22 

result: 484 

第 一 次 运行 时 我 们 指定 服务 右 主 机 的 主机 名 ， 第 二 次 运行 时 指定 
它 的 IP 地 址 。 这 表明 客户 程序 调用 的 clnt_create 芳 数 以 及 RPC 运 行 时 函 
数 都 是 既 允 许 使 用 主机 和 名， 也 人 允许 使 用 耻 地 址 。 

接着 展示 服务 器 主机 不 存在 或 者 尽管 存在 但 没有 运行 我 们 的 服务 
器 程序 时 ， 由 clnt_create 返 回 的 一 些 错误 。 


solaris 96 client nosuchhost 11 


nosuchhost: RPC: Unknown host 出 目 RPC 运 行 时 系统 

clnt_create error tH EL Ee EY ee KZ 

solaris 96 client localhost 11 

localhost: RPC: Program not registered 

cInt. create error 

我 们 已 编写 了 一 个 客户 程序 和 一 个 服务 器 程序 ， 并 展示 了 其 中 没 
有 使 用 任何 显 式 的 网 络 编程 方式 。 我 们 的 客户 程序 只 是 调用 两 个 函数 

(cInt create 和 squareproc 1) ， 而 在 服务 器 方 ， 我们 只 是 编写 
squareproc 1 svc Ki ° 1? Solaris FAYXTI ^ BSD/OS T HES UI 
网 络 MO 的 所 有 细节 都 由 RPC 运 行 时 系统 来 处 理 。 这 就 是 RPC 的 目的 : 
不 需要 显 式 的 网 络 编程 知识 束 允 许 编写 分 布 式 应 用 程序 。 

本 例子 的 另 一 个 重要 之 处 在 于 ， 所 用 的 两 个 系统 (运行 Solaris 的 
Sparc 系 统 和 运行 BSD/OS 的 Intel x86 系 统 ) 具有 不 同 的 字 节 序 (byte 
order) 。 其 中 Sparc 系 统 是 大 端 (big endian) WF, Intel 系 统 是 小 端 

(little endian) 字 节 序 (我 们 在 UNPv1 的 3.4 闻 中 展示 了 这 两 种 字 节 
F) 。 这 些 字 节 排序 上 的 差异 也 是 由 运行 时 函数 库 自动 处 理 的 ， 其 中 
使 用 了 一 个 称 为 XDR (external data representation， 外 部 数据 表示 ) 的 
标准 ， 我 们 将 在 16.8 市 中 讨论 。 

本 例子 中 客户 程序 和 服务 器 程序 的 构建 所 涉及 的 步骤 比 本 书 中 其 
他 程序 的 构建 都 要 多 。 下 面 是 构建 客户 程序 可 执行 文件 所 涉及 的 步 
VR: 


solaris 96 rpcgen -C square.x 


solaris 96 cc -c client.c -o client.o 

solaris 96 cc -c square clnt.c -o square clnt.o 

solaris 96 cc -c square xdr.c -o square xdr.o 

solaris 96 cc -o client client.o square clnt.o square xdr.o libunpipc.a - 


Insl 


其 中 rpcgen 的 -C 选 项 告诉 它 在 square.h 头 文件 中 生成 ANSIC 原 型 。 
rpcgen 还 产生 一 个 称 为 客户 程序 存根 (client stub ) 的 源 文 件 
square_clntc 和 一 个 名 为 square_xdrc 的 用 来 处 理 XDR 数 据 转 换 的 文件 。 
libunpipc.a 是 我 们 的 函数 库 〈 存 放 本 书 中 所 用 的 函数 ) ，-Insl 选 项 则 指 
定 Solaris 下 存放 网 络 支 撑 函 数 (包括 RPC 和 XDR 运 行 时 系统 ) WASH 

构建 服务 器 程序 时 我 们 会 看 到 类 似 的 命令 ， 不 过 rpcgen 不 必 再 运 
行 。 文 件 square_svc.c 中 含有 服务 器 程序 main 函 数 ， 另 外 ， 构 建 客 户 程 
序 时 生成 的 含有 XDR 画 数 的 square_xdro 文 件 在 服务 器 程序 的 构建 中 也 


solaris 96 cc -c server.c -0 server.o 


solaris 96 cc -c square svc.c -0 square svc.o 

solaris 96 cc -0 server server.o square svc.o square xdr.o libunpipc.a - 
Ins] 

这 样 会 生成 都 运行 在 Solaris 下 的 客户 程序 和 服务 器 程序 。 

当 客户 程序 和 服务 器 程序 是 为 不 同 的 系统 构建 时 (例如 在 我 们 早 
先 的 例子 中 ， 客 户 程序 运行 在 Solaris 下 ， 服 务 器 程序 运行 在 BSD/OS 
下 ) ， 可 能 需要 额外 的 步骤 。 举 例 来 说 ， 某 些 文件 必须 共享 (例如 通 
过 NFS) 或 者 在 两 个 系统 之 间 复 制 ， 另 外 ， 客 户 程序 和 服务 器 程序 都 使 
用 的 文件 (square xdro) 必须 在 每 个 系统 上 分 别 编译 。 

图 16-4 汇 总 了 构建 我 们 的 客户 -服务 右 例 子 程序 所 需 的 文件 和 步 
又 。 其 中 三 个 带 阴 影 的 方 框 是 我 们 必须 编写 的 文件 。 短 划 线 指出 了 需 
要 C 伪 指令 机 nclude square.h 的 那些 文件 。 
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rpcgen 
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图 16-4 构建 一 个 RPC 窗 户 -服务 器 程序 所 需 的 步骤 汇总 

图 16-5 汇 总 了 一 次 远程 过 程 调用 中 通常 发 生 的 步 台 。 编 了 号 的 步 又 
是 按 顺序 执行 的 。 

(0) 服 务 器 启动 ， 它 向 所 在 主机 上 的 端口 映射 器 (port mapper) 注 
册 自 身 。 然 后 客户 启动 ， 它 调用 clnt_create， 该 函数 则 与 服务 器 主机 上 
的 端口 映射 侨联 系 ， 以 找到 服务 器 的 临时 端口 。clnt_create 琅 数 还 建立 
一 个 与 服务 器 的 TCP 连 接 (因为 我 们 在 图 16-2 中 指定 的 协议 为 TCP) 。 
我 们 在 本 图 中 没有 展示 这 些 步 台 ， 留 待 16.3 节 中 详细 地 讲述 。 

(1) 客 户 调 用 一 个 称 为 客户 程序 存根 (client stub) 的 本 地 过 程 。 在 
图 16-2 中 ， 该 过 程 名 为 squareproc 1， 而 含有 这 个 客户 程序 存根 的 文件 
是 由 rpcgen 产 生 的 ， 名 为 square_clntc。 对 于 客户 来 说 ， 客 户 程序 存根 
看 起 来 像 是 它 想 要 调用 的 真正 的 服务 器 过 程 。 存 根 的 目的 在 于 把 有 符 
传递 给 远程 过 程 的 参数 打 成 包 ， 可 能 的 话 把 它们 转换 成 菜 种 标准 格 
式 ， 然 后 构造 一 个 或 多 个 网 络 消 思 。 把 客户 提供 的 参数 打包 成 一 个 网 
络 消息 的 过 程 称 为 集结 (marshaling) 。 客 户 程 序 的 各 个 例 程 和 存根 通 


常 调 用 RPC 运 行 时 函数 库 中 的 函数 《例如 我 们 早先 的 例子 中 的 
clnt_create) 。 在 Solaris 下 链接 时 ， 这 些 运行 时 库 函 数 是 从 _lnsl 函 数 库 
中 加 载 的 ， 而 BSD/OS 下 它们 是 在 标准 C 函 数 麻 中 。 


客户 进程 服务 器 进程 
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l 
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square xdr.c 
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图 16-5 一 次 远程 过 程 调用 中 涉及 的 步骤 

(2) 这 些 网 络 消 息 由 客户 程序 存根 发 送 给 远程 系统 。 这 通常 需要 一 
次 陷入 本 地 内 核 的 系统 调用 (例如 write 或 sendto) ° 

(3) 这 些 网 络 消 息 传送 到 远程 系统 。 这 一 步 所 用 的 典型 网 络 协议 为 
TCP 或 UDP ° 

(4) 一 个 服务 器 程序 存根 (sever stub) 过 程 一 直 在 远程 系统 上 等 
客户 的 请 求 。 它 从 这 些 网 络 消息 中 解散 (unmarshaling) 出 参数 。 

(5) 服 务 需 程序 存根 执行 一 个 本 地 过 程 调用 以 激活 真正 的 服务 丹 画 
数 〈 图 16-3 中 我 们 的 squareproc_1_svc 过 程 ) ， 传 递 给 该 画 数 的 参数 是 
它 从 来 日 客户 的 网 络 消 已 中 解散 出 来 的 。 

(6) 当 服务 絮 过 程 完成 时 ， 它 向 服务 器 程序 存根 返回 其 返回 值 。 

(7) 服 务 器 程序 存根 在 必要 时 对 返回 值 进行 转换 ， 然 后 把 它们 集结 
到 一 个 或 多 个 网 络 消息 中 ， 以 便 发 送 回 客户 。 


en 


(8) 这 些 消 忆 通 过 网 络 传送 回 客户 。 

(9) 窜 户 程序 存根 从 本 地 内 核 中 读 出 这 些 网 络 消息 〈 例 如 read 或 
recvfrom) 。 

(10) 对 返回 值 进 行 可 能 的 转换 后 ， 窜 户 程序 存根 最 终 返 回 客户 函 
数 。 这 一 步 看 起 来 像 是 一 个 普通 的 过 程 返回 客户 。 

16.1.2 历史 

关于 RPC 的 最 早期 论文 之 一 也 许 是 【White 1975] 。 按 照 [Corbin 
1991] 的 陈述 ，White 当 时 转 到 了 Xerox (施乐 ) 公司 ， 那 儿 于 是 开发 
了 若干 个 RPC 系 统 。 其 中 之 一 的 Courier 是 于 1981 年 面世 的 一 个 产品 。 
关于 RPC 的 经 典 论文 是 [Birrell and Nelson 1984] ， 它 讲述 了 20 世 纪 80 
年 代 早 期 在 Xerox 公 司 的 Dorado 单 用 户 工 作 站 上 运行 的 Cedar 项 目的 RPC 
机 制 。Xerox 在 大 多 数 人 还 不 知道 工作 站 是 什么 的 时 候 束 打算 在 工作 站 
上 实现 RPC 了 !Courier 的 一 个 Unix 实 现 版 本 随 4.x BSD 各 个 发 行 版 本 传播 
了 许多 年 ， 不 过 现今 Courier 只 具有 历史 意义 了 。 

Sun 公 司 于 1985 年 发 行 它 的 RPC 软 件 包 的 第 一 个 版 本 。 它 是 由 Bob 
Lyon 开 发 的 ，Bob 于 1983 年 离开 Xerox 加 入 Sun。 它 的 正式 名 字 是 
ONC/RPC: Open Network Computing Remote Procedure Call (开放 的 网 
络 计 算 远 程 过 程 调用 ) ， 不 过 往往 被 称 为 “<Sun RPC”。 技 术 上 讲 ， 它 类 
似 于 Courier。Sun RPC 的 初期 版 本 是 用 套 接 字 API 编 写 的 ， 既 能 用 于 
TCP， 也 能 用 于 UDP。 公 开 可 得 的 兰 代 码 版 本 称 为 RPCSRC。20 世 纪 90 
年 代 早 期 ，Sun RPC 改 用 TLI API 重 新 编写 ， 能 用 于 内 核 支持 的 任何 网 
络 协 议 ， 其 中 TLI 是 XTI (在 UNPv1 第 四 部 分 讲述 ) 的 前 身 。 套 接 字 版 
本 和 TLI1 版 本 的 公开 可 得 源 人 代码 实现 都 可 从 
ftp: //playground.sun.com/pub/rpc 中 获得 ， 前 者 的 名 字 为 rpcsrc， 后 者 的 
名 字 为 tirpcsrc 〈 称 为 TIL-RPC， 其 中 “TD 代表 “传输 独立 (transport 
independent) ”) 。 


RFC 1831 [Srinivasan 1995a| 提供 了 Sun RPCRS— THE, FHL 
了 通过 网 络 发 送 的 RPC 消 息 的 格式 。RFC 1832 [Srinivasan 1995b | 讲 
述 了 XDR， 既 包括 所 文 持 的 数据 类 型 ， 又 包括 它们 的 “在 线 上 (on the 
wire) ”格式 。RFC 1833 | Srinivasan 1995c] 讲述 了 捆绑 协议 : 
RPCBIND E ERI £f Ym O HITAN ° 

使 用 Sun RPC 的 最 广泛 流行 的 应 用 也 许 是 NFS， 即 Sun 的 网 络 文件 
系统 。 正 常情 况 下 ，NFS 不 是 使 用 本 章 讲述 的 标准 RPC 工 具 、rpcgen 以 
及 RPC 运 行 时 函数 库 构 造 的 。 相 反 ， 它 的 大 多 数 库 例 程 是 手工 优化 过 
的 ， 并 且 因 性 能 原因 而 驻 留 在 内 核 中 。 然 而 支持 NFS 的 大 多 数 系统 也 文 
持 Sun RPC ° 

20 世 纪 80 年 代 中 期 ，Appollo 公 司 与 Sun 在 工作 站 市 场 展 开 竞 争 ， 并 
自行 设计 了 称 为 NCA (Network Computing Architecture， 网 络 计算 体系 
结构 ) 的 RPC 软 件 包 与 Sun RPC 一 较 高 下 ， 其 实现 称 为 NCS (Network 
Computing System, ， 网 络 计 算 系 统 ) 。NCA/RPC 是 RPC 协 议 ，NDR 

(Network Data Representation ， 网 络 数据 表示 ) 类 似 于 Sun 的 XDR， 

NIDL (Network Interface Definition Language， 网 络 接口 定义 语言 ) 则 
定义 了 客户 和 服务 器 之 间 的 接口 (例如 类 似 于 图 16-1 中 的 .x 文件 ) 。 运 
行 时 函数 库 称 为 NCK (Network Computing Kernel， 网 络 计算 内 核 ) 。 

Apollo 于 1989 年 被 Hewlet.Packard (AFF) 公司 收购 ，NCA 于 是 发 
展 成 为 开放 软件 基金 会 (OF) 的 分 布 式 计算 环境 

(Distribute.Computin.Environment, DCE) ， 其 中 RPC 是 一 个 基本 元 

素 ， 大 多 数 部 件 就 构建 在 其 上 上。 有关 DCE 的 详细 信息 可 从 
http://www.camb.opengroup.org/tech/dce 中 得 到 。DC.RPC 软 件 包 有 一 个 
实现 是 公开 可 得 的 ， 其 URL 为 ftp://gatekeeper.dec.com/pub/DEC/DCE ° 
该 目录 还 含有 一 个 171 页 的 文档 ， 讲 述 DC.RPC 软 件 包 的 内 部 工作 原 
理 。 许 多 平台 上 有 DCE 可 用 。 


Sun RPC 比 DCE RPC 要 流行 得 多 ， 其 原因 也 许 是 前 者 有 人 免费 可 得 的 
实现 ， 而 且 大 多 数 版 本 的 Unix 把 Sun RPC 软 件 包 作为 基本 系统 的 一 部 分 
提供 。DCE RPC 通 常 是 作为 一 个 增值 (也 就 意味 着 单独 计价 ) 特性 提 
供 的 。 它 的 公开 可 得 实现 并 没有 得 到 广泛 的 移植 ， 尺 管 往 Linux 上 的 移 
植 正在 进展 中 。 本 书 中 我 们 只 讨论 Sun RPC ° Courier ` Sun RPC 和 DCE 
RPC 这 三 个 RPC 软 件 包 都 极其 相似 ， 因 为 基本 的 RPC 概 念 是 一 样 的 。 

大 多 数 Unix 厂 家 提供 关于 Sun RPC 的 除 手册 页 面 外 的 详细 文档 。 举 
例 来 说 ，Sun 的 文档 可 从 http://docs.sun.com 7k 取 ， 在 “Developer 
Collection (开发 人 员 资 料 汇 编 ) "BIBT, CHAN 
“ONC+Developer’S Guide (ONC+ 开 发 人 员 指 南 ) ”的 共 280 页 的 一 个 音 
分 o Digital Unix 的 pa 档 可 从 
http://www.u_nix.digital.com/faqs/publications/pub_page/V40D_DOCS.HT 
M 和 获取 ， 包 括 一 本 题目 为 "Programming with ONC RPC (使 用 ONC RPC 
编程 ) ”的 116 页 手册 。 

RPC 本 里 是 一 个 让 人 争议 的 主题 。http:/www.kohala.com/ ~ 
rstevens/papers.others/rpc.comments.txt 中 收集 了 天 于 这 个 主题 的 8 篇 文 
=F o 

本 章 中 我 们 假设 给 大 多 数 例子 使 用 TIL-RPC 〈 早 移 提 及 的 传输 独立 
版 本 的 RPC) ， 其 中 TCP 和 UDP 作为 TI-RPC 文 持 的 协议 讨论 ， 不 过 ITL 
RPC 能 够 文 持 主 机 所 能 文 持 的 任何 协议 。 


16.2 多 线程 化 


回想 图 15-9， 我 们 从 中 展示 了 由 门 服务 器 执行 的 自动 线程 管理 ， 由 
此 默认 提供 了 一 个 并 发 服务 器 。 我 们 现在 展示 Sun RPC 默 认 提供 的 是 一 
个 迭代 服务 器 (iterative server) 。 我 们 从 上 一 节 中 的 例子 程序 着 手 ， 


并 只 修改 其 中 的 服务 器 过 程 。 图 16-6 给 出 了 这 个 新 函数 ， 它 输出 所 在 线 
程 的 线程 ID， 睡 眠 5 秒 钟 ， 再 输出 目 己 的 线程 ID， 人 然后 返回 。 


sunrpc/square2/server.c 


1 #include "unpipc.h" 
2 #include "Square .hn 


3 square out * 
4 squareproc 1 svc(square in *inp, struct svc req *rqstp) 


S1 

6 static square out out; 

7 printf ("thread $1d started, arg = %ld\n", 

8 pr thread id(NULL), inp-»argl); 

9 sleep(5); 

10 out.resl = inp-»argl * inp-»argl; 

11 printf ("thread $1d done\n", pr thread id(NULL)); 
T2 return (&out) ; 

13 st 


sunrpc/square2/server.c 


图 16-6 睡眠 5 秒 钟 的 服务 器 过 程 
我 们 启动 服务 器 ， 然 后 运行 客户 程序 三 次 : 
solaris 96 client localhost 22 & client localhost 33 & \ 


client localhost 44 & 

[3] 25179 

[4] 25180 

[5] 25181 

solaris 96 result: 484 shell 提 示 符 输出 后 约 5 秒 
result: 1936 男 一 个 5 秒 后 
result: 1089 男 一 个 5 秒 后 


尽管 光 看 这 些 输出 ， 我 们 不 能 识别 每 个 客户 输出 各 目的 结 采 时 彼 
此 间 有 5 秒 钟 的 等 竺 发生。 然而 要 是 碍 看 服务 器 的 输出 ， 我 们 束 会 看 到 
各 个 客户 请 求 是 欠 代 地 处 理 的 : 处 理 完 第 一 个 客户 的 请 求 后 ， 接 着 处 
理 第 二 个 客户 的 请 求 直 到 处 理 完毕 ， 最 后 是 处 理 第 三 个 客户 的 请 求 直 
到 处 理 完毕 。 


solaris 96 server 


thread 1 started,arg = 22 

thread 1 done 

thread 1 started,arg = 44 

thread 1 done 

thread 1 started,arg = 33 

thread 1 done 

可 看 出 单个 线程 在 处 理 所 有 的 客户 请 求 : 默认 情况 下 服务 器 并 不 
多 线程 化 。 

第 15 章 中 我 们 的 门 服务 器 程序 从 shell 启 动 时 都 运行 在 前 台 ， 例 
如 : 

solaris % server 

这 样 允 许 我 们 在 服务 絮 过 程 中 放置 调试 用 的 printf 调 用 。 但 是 Sun 
RPC 服 务 句 默认 作为 守护 进程 运行 ， 也 就 是 执行 了 UNPvV1 的 12.4 玉 [5] 
中 概括 出 的 者 干 步 骤 。 这 就 要 求 从 服务 器 过 程 中 调用 syslog 来 输出 任何 
诊断 信息 。 人 然而 我 们 的 做 法 是 在 编译 服务 器 程序 时 指定 C 编 译 器 标志 - 
DDEBUG, ， 这 跟 在 服务 器 程序 存根 《由 rpcgen 产 生 的 square_svc.c 文 
件 ) 中 放置 如 下 行 是 等 效 的 : 

#define DEBUG 
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序 ， 服 务 需 于 是 继续 连接 到 局 动 它 的 终端 上 。 这 就 是 我 们 可 以 从 服务 
锅 过 程 中 调用 printf 的 原因 。 

Sun RPC 是 随 Solaris 2.4 提 供 多 线程 化 的 服务 絮 的 ， 它 通过 向 rpcgen 
指定 一 个 -M 命 令 行 选项 启用。 这 使 由 rpcgen 广 生 的 服务 絮 代 码 变 得 线 
程 安 全 。 另 一 个 选项 -A 是 让 服务 器 根据 处 理 新 客户 请 求 的 需要 目 动 创 
建 线程 。 我 们 运行 mpcgen 时 ， 同 时 使 能 这 两 个 选项 。 

客户 程序 和 服务 器 程序 的 源 代 码 都 需要 修改 ， 这 是 我 们 应 该 预期 
到 的 ， 因 为 我 们 在 图 16-3 中 使 用 了 static 类 型 变量 。 对 square.x 文 件 的 唯 


一 改动 是 把 版 本 号 从 1 改 为 2。 服 务 器 过 程 的 参数 结构 和 结果 结构 的 声 
明 都 不 变 。 
图 16-7 给 出 了 新 的 客户 程序 。 


sunrpc/square3/client.c 


1 #include "unpipc.h" 

2 #include "square.h" 

3 int 

4 main(int argc, char **argv) 

5 { 

6 CLIENT *cl; 

7 square_in in; 

8 square out out; 

9 i£ farge; = 3) 

10 err quit("usage: client «hostname» <integer-value>") ; 
alae cl = Clnt create(argv[1], SQUARE PROG, SQUARE VERS, "tcp"); 
12 in.argl = atol(argv[2]); 

13 if (squareproc 2(&in, &out, cl) !- RPC SUCCESS) 

14 err quit("$s", clnt sperror(cl, argv[11)); 
15 printf("result: %ld\n", out.res1); 
16 exit (0); 
17 } 


sunrpc/square3/client.c 


图 16-7 用 于 多 线程 化 服务 器 的 客户 程序 main 函 数 


声明 存放 结果 的 变量 

8 声明 一 个 square_out 类 型 的 变量 ， 而 不 是 指 癌 该 类 型 的 一 个 指 
TUS 

过 程 调用 的 新 参数 

12~ 14 指 回 我 们 的 out 变 量 的 指针 成 为 squareproc_ 2 的 第 二 个 参 
数 ， 客 户 句 柄 则 是 最 后 一 个 参数 。 该 函数 返回 的 不 再 是 指 癌 结 采 的 指 
针 (如 图 16-2 中 所 示 ) ， 而 是 返回 RPC_SUCCESS， 或 者 返回 表示 发 生 
错误 的 某 个 其 他 值 。<rpc/clnt_stat.h> 头 文件 中 的 clnt_stat 枚 举 列 出 了 所 
有 可 能 的 出 错 返 回 值 (enum) 。 

图 16-8 给 出 了 新 的 服务 器 过 程 。 与 图 16-6 一 样 ， 它 输出 目 己 所 在 线 
程 的 线程 ID， 睡 眠 5 秒 钟 ， 输 出 另 一 个 消息 ， 然 后 返回 。 


sunrpc/square3/server.c 


1 #include "unpipc.h" 

2 #include "Square .hn 

3 bool 七 

4 squareproc 2 svc(square in *inp, square out *outp, struct svc req *rqstp) 
5 

6 printf("thread $1d started, arg = %ld\n", 

7 pr thread id(NULL), inp-»argl); 

8 sleep(5); 

9 outp-»res1 = inp->argl * inp->argl; 
10 printf ("thread $1d done\n", pr thread id (NULL)); 

T1. return(TRUE); 

12 } 
13 int 
14 square prog 2 freeresult (SVCXPRT *transp, xdrproc t xdr result, 
15 caddr t result) 
16 ( 
17 xdr free(xdr result, result); 
18 return(1); 
19 } 


sunrpc/square3/server.c 


图 16-8 多 线程 化 的 服务 器 过 程 


新 的 参数 和 返回 值 

3-12 多 线程 化 所 需 的 变动 涉及 函数 参数 和 返回 值 。 我 们 不 再 返回 
一 个 指向 结果 结构 的 指针 (如 图 16-3 中 所 示 ) ， 指 向 该 结构 的 指针 现在 
成 了 本 函数 的 第 二 个 参数 。 指 向 svc_req 结 构 的 指针 现在 变 为 第 三 个 参 
数 。 本 函数 的 返回 值 在 成 功 时 为 TRUE， 在 发 生 错 误 时 为 FALSE。 

释放 XDR 内 存 空 间 的 新 函数 

13~19 我 们 必须 完成 的 另 一 个 源 代 码 变动 是 提供 一 个 函数 来 释放 
自动 分 配 的 内 存 空 间 。 该 范 数 是 在 服务 需 过 程 返 回 并 且 其 结果 已 发 送 
给 客户 后 ， 从 服务 器 程序 存根 中 调用 的 。 在 图 16-8 中 ， 我 们 只 是 调用 普 
通 的 xdr_free 了 范 数 。 (我 们 将 随 图 16-19 和 习题 16.10 详 细 讨 论 该 函 
数 。) 要 是 我 们 的 服务 器 过 程 曾经 分 配 了 任何 必要 的 内 存 空间 以 容纳 
结果 ( 辟 如 说 一 个 链表 ) ， 这 个 新 函数 就 可 以 释放 这 部 分 内 存 空 间 。 

构造 出 新 的 客户 程序 和 服务 器 程序 后 ， 我 们 再 次 同时 运行 客户 程 
序 的 三 个 副本 : 


solaris 96 client localhost 55 & client localhost 66 & ^ 


client localhost 77 & 


[3] 25427 
[4] 25428 
[5] 25429 


solaris 96 result: 4356 

result: 3025 

result: 5929 

这 一 次 我 们 能 够 辨别 出 那 三 个 结果 是 一 个 紧 接 一 个 地 输出 的 。 查 
看 服务 器 的 输出 ， 我 们 看 到 服务 絮 使 用 了 三 个 线程 ， 它 们 是 同时 运行 
的 。 


solaris 96 server 


thread 1 started,arg = 55 

thread 4 started,arg = 77 

thread 6 started,arg = 66 

thread 6 done 

thread 1 done 

thread 4 done 
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非 所 有 系统 都 文 持 这 个 特性 。 举 例 来 说 ，Digital Unix 4.0B #1 BSD/OS 
3.1 提 供 的 都 是 不 文 持 多 线程 化 的 较 老 的 RPC 系 统 。 这 意味 着 如 果 我 们 
想 在 这 两 种 类 型 的 系统 上 编译 和 运行 一 个 程序 ， 那 么 在 其 客户 程序 和 
服务 器 程序 中 必须 加 入 一 些 划 fdef 伪 指令 以 处 理 在 调用 序列 上 存在 的 差 
异 。 当 然 举 例 来 说 ，BSD/OS 上 未 线程 化 的 一 个 客户 仍 能 调用 运行 在 
Solaris 上 的 一 个 多 线程 化 的 服务 絮 过 程 ， 但 是 如 果 我 们 有 一 个 希望 在 这 
两 种 类 型 的 系统 上 都 能 编译 的 RPC 客 户 程 序 (或 服务 器 程序 ) ， 那 就 
有 必要 修改 源 代码 以 处 理 这 些 靳 异 。 


16.3 PBI 
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本 地 端口 映射 器 (port mapper) 注册 自身 ， 客 户 如 何 发 现 服务 器 的 端口 
值 。 首 先 应 注意 的 是 ， 运 行 RPC 服 务 器 的 任何 主机 必须 在 运行 端口 映 
射 器 。 赋 给 端口 映 映 器 的 是 TCP 端 口 11 和 UDP 端口 11， 它 们 是 赋 给 
Sun RPC 的 唯一 的 因特网 固定 端口 。RPC 服 务 器 总 是 先 捆 绑 一 个 临时 端 
口 ， 再 癌 本 地 端口 映射 句 注 册 目 己 的 临时 端口 。 当 一 个 客户 局 动 时 ， 
它 必 须 首 移 跟 服 务 避 主 机 上 的 端口 映射 右 联 系 ， 询 问 服 务 圳 的 临时 端 
口号 ， 然 后 跟 这 个 临时 端口 上 的 服务 絮 联 系 。 端 口 映射 器 提供 了 一 个 
范围 局 限于 所 在 系统 的 名 字 服 务 。 

有 些 读者 会 声称 NFS 也 有 一 个 固定 的 端口 号 2049。 尺 管 许多 实现 默 
认 使 用 这 个 端口 ， 而 且 某 些 较 早 的 实现 还 把 这 个 端口 号 硬 编 码 到 客户 
程序 和 服务 器 程序 中 ， 但 是 大 多 数 当 今 的 实现 允许 使 用 其 他 端口 号 。 
大 多 数 NFS 客 户 也 是 通过 与 服务 器 主机 上 的 端口 映射 器 联系 来 获取 NEFS 
服务 器 的 端口 号 的 。 

随 着 Solaris 2.x 的 出 现 ，Sun 公 司 把 端口 映射 器 改名 为 RPCBIND 。 
换 名 的 原因 在 于 , “端口 ”一 词 隐 指 因特网 端口 ， 而 TI-RPC 软 件 包 能 够 
工作 在 任何 网 络 协议 上 ， 不 只 是 工作 在 TCP 和 UDP 协议 上 。 我 们 还 是 使 
用 传统 的 名 字 : 端口 映射 右 。 另 外 在 下 面 鸭 讨论 中 ， 我 们 假设 服务 需 
主机 只 支持 TCP 和 UDP 协 议 。 

服务 器 和 客户 是 按 如 下 的 步骤 执行 的 。 

(1) 当 系统 进入 多 用 户 模 式 时 ， 端 口 映 射 右 启动。 其 可 执行 文件 名 
一 般 为 portmap 或 rpcbind。 

(2) 当 我 们 的 服务 器 启动 时 ， 它 的 main 函 数 《该 男 数 属于 由 rpcgen 
产生 的 服务 器 程序 存根 的 一 部 分 ) 调用 库 函 数 svc_create。svc_create 确 
定 本 主机 所 支持 的 网 络 协议 ， 并 为 每 个 协议 创建 一 个 传输 端点 (例如 


ERF) ， 给 TCP 和 UDP 端点 各 捆绑 一 个 临时 端口 。 该 函数 然后 与 本 地 
的 端口 映射 器 联系 ， 向 它 注册 (TCP 和 UDP) 这 两 个 临时 端口 号 以 及 调 
用 程序 的 RPC 程 序号 和 版 本 号 。 

端口 映射 器 本 身 是 一 个 RPC 程 序 ， 服 务 器 就 是 使 用 RPC 调 用 向 端口 
映射 器 注册 自身 的 (不 过 所 用 端口 为 已 知 的 111) ° RFC 1833 

[Srinivasan 1995c| 中 有 端口 映射 器 所 支持 过 程 的 相关 说 明 。 这 个 RPC 

程序 存在 三 个 版 本 : 版 本 2 是 历史 久远 的 端口 映射 器 ， 只 处 理 TCP 和 
UDP 端口 ， 版 本 3 和 版 本 4 则 采用 较 新 的 RPCBIND 协 议 。 

通过 执行 rpcinfo 程 序 ， 我 们 可 以 看 到 已 向 端口 映射 器 注册 了 的 所 
有 RPC 程 序 。 我 们 可 执行 该 程序 来 验证 端口 映射 器 本 号 使 用 端口 号 
111 ° 


solaris % rpcinfo -p 
program vers proto port service 


100000 4 tcp 111 rpcbind 


100000 3 tcp 111 rpcbind 
100000 2 tcp 111 rpcbind 
100000 4  udp 111 rpcbind 
100000 3 udp 111 rpcbind 


100000 2 udp 111 rpcbind 
(我 们 已 省 略 掉 了 输出 中 的 许多 额外 的 行 。) 我 们 看 到 Solaris 2.6 
支持 所 有 三 个 版 本 的 协议 ， 全 部 在 端口 111 上 ， 并 且 或 者 使 用 TCP， 或 
者 使 用 UDP。 从 RPC 程 序号 到 服务 号 的 映射 关系 通 名 存放 在 文 
件 /etcrpc 中 。 在 BSD/OS 3.1 下 执行 同样 的 命令 ， 结 果 表 明 它 只 文 持 和 版 
本 2 的 端口 映射 器 RPC 程 序 。 
bsdi 96 rpcinfo -p 


program vers proto port 


100000 2 tcp 111 portmapper 


100000 2 udp 111 portmapper 
Digital Unix 4.0B 也 只 支持 版 本 2: 
alpha 96 rpcinfo -p 
program vers proto port 
100000 2 tcp 111 portmapper 
100000 2 udp 111 portmapper 
然后 我 们 的 服务 器 程序 进入 睡眠 ， 等 待 客户 请 求 的 到 达 。 这 种 请 
求 可 以 是 在 其 TCP 端 口上 的 一 个 痢 连 接 ， 也 可 以 是 在 其 UDP 端口 上 的 一 
个 UDP 数据 报 的 到 达 。 局 动 图 16-3 给 出 的 服务 器 后 执行 rpcinfo， 我 们 看 
Fij: 


solaris % rpcinfo -p 


program vers proto port service 

824377344 1 udp 47972 

824377344 1 tcp 40849 

其 中 824377344 等 于 0x31230000， 它 是 我 们 在 图 16-1 所 赋 的 程序 
号 。 我 们 还 在 该 图 中 赋 了 一 个 值 为 1 的 版 本 号 。 注 意 ， 服 务 器 准备 好 或 
者 使 用 TCP 或 者 使 用 UDP 接受 客户 请 求 ， 客 户 则 在 创建 客户 句柄 时 选择 
使 用 其 中 哪个 协议 (图 16-2 中 clnt_cre_ate 的 最 后 一 个 参数 ) © 

(3) 客 户 启动 并 调用 clnt_create。 该 函数 的 参数 (图 16-2) 包括 : Ak 
务 器 主机 的 主机 名 或 人 PP 地址 、 程 序号、 版 本 号 及 指定 所 用 协议 的 字符 
串 。 客 户 向 服务 器 主机 的 端口 映射 器 发 送 一 个 RPC 请 求 (这 个 RPC 消 息 
通常 使 用 UDP 作为 所 用 协议 ) ， 询 问 关 于 所 指定 的 程序 、 版 本 和 协议 
的 信息 。 假 设 成 功 的 话 ， 作 为 答复 的 服务 器 端口 号 就 保存 到 客户 句柄 
中 ， 供 将 来 使 用 该 句柄 的 所 有 RPC 调 用 参考 。 

在 图 16-1 中 ， 我 们 给 例子 程序 使 用 了 值 为 0x31230000 的 程序 号 。 这 
个 32 位 的 程序 号 是 划分 成 组 的 ， 如 图 16-9 所 示 。 


0x00000000-0x1fffffff 由 Sun 定 义 


0x20000000-0x3fffffff 由 用 户 定 义 


0x40000000-0x5fffffff 临时 《〈 供 客户 编写 的 应 用 程序 用 ) 


0x60000000-0xffffffff 保留 


图 16-9 Sun RPC 的 程序 号 范围 


rpcinfo 程 序 显 示 本 系统 上 当前 已 注册 的 程序 。 一 个 给 定 系 统 上 所 
支持 RPC 程 序 的 相关 信息 的 另 一 个 来 源 是 目录 /usr/inelude/rpcsvc 中 的 .x 
文件 。 

inetd 和 RPC 服 务 器 

默认 情况 下 ， 由 rpcgen 创 建 的 服务 器 可 由 inetd 超 级 服务 器 激活 。 

(UNPv1812.575 [6] 详细 讨论 了 inetd。) 查看 由 rpcgen 产 生 的 服务 器 
程序 存根 ， 可 看 到 服务 器 程序 main 函 数 启动 时 ， 会 检查 标准 输入 是 不 
是 一 个 XTI 问 点 ， 看 是 则 假定 目 喘 是 由 inetd 司 动 的 。 

为 了 文 持 这 一 特性 ， 在 创建 了 一 个 将 由 inetd 激 活 的 一 个 RPC 服 务 
器 之 后 ， 必 须 以 该 服务 器 的 信息 更 新 /etcinetd.conf 配 置 文件 ， 这 些 信息 
包括 : RPC 程 序 名 、 所 支持 的 程序 号 、 所 支持 的 协议 、 服 务 器 程序 可 
执行 文件 的 路 径 名 。 作 为 一 个 例子 ， 下 面 是 出 目 Solaris 配 置 文件 中 的 一 
行 : 


rstatd/2-4 tli rpc/datagram v wait root 


/usr/lib/netsvc/rstat/rpc.rstatd rpc.rstatd 
其 中 第 一 栏 是 程序 名 〈 它 将 被 映射 成 相应 的 程序 号 ， 这 种 映射 天 
系 存放 在 /etc/rpc 文 件 中 ) ， 所 文 持 的 版 本 为 2、3 和 4。 下 一 栏 指定 一 个 
XTIm m 〈 与 套 接 字 端 点 相对 立 ) ， 第 三 栏 指定 所 有 可 见 的 数据 报 协议 
都 受 支 持 。 查 看 文件 /etc/neteonfig， 看 到 这 样 的 协议 有 两 个 : UDP 
和 /dev/clts。 《UNPv1 第 29 章 讲述 该 文件 和 XITI 地 址 。) 第 四 栏 wait 告 诉 


inetd 在 监听 发 往 相 应 XTI 端 点 的 下 一 个 客户 请 求 前 ， 先 等 每 本 服务 器 当 
前 这 次 激活 终止 。/etcinetd.conf 中 的 所 有 RPC 服 务 器 都 指定 wait 属 性 。 
再 下 一 栏 root 指 定 本 程序 将 在 这 个 用 户 ID 下 运行 ， 最 后 两 栏 是 本 程 
序 可 执行 文件 的 路 径 名 以 及 程序 名 ， 外 带 传 递 给 该 程序 的 任何 命令 行 
参数 (本 程序 没有 命令 行 参 数 ) 。 
inetd 将 给 所 指定 的 程序 及 版 本 创建 XTI 端 点 ， 并 癌 端 口 映 射 需 登记 
这 些 端点 。 我 们 可 使 用 rpcinfo 程 序 验 证 这 一 点 : 


solaris 96 rpcinfo | grep statd 


100001 2 udp 0.0.0.0.128.11 rstatd 
superuser 

100001 3 udp 0.0.0.0.128.11 rstatd 
superuser 

100001 4 udp 0.0.0.0.128.11 rstatd 
superuser 

100001 2 ticlts 300030001020, rstatd 
superuser 

100001 3 ticlts 300030001020, rstatd 
superuser 

100001 4 ticlts 300030003020, rstatd 
superuser 


其 中 第 四 栏 是 XTI 地 址 的 可 显示 格式 ( 它 是 逐个 字 节 输出 的 ) ， 
128x256+11=32779 是 分 配给 该 XTI 端 点 的 UDP 临 时 端口 号 。 

当 一 个 UDP 数据 报到 达 端 口 32779 时 ，inetd 将 检测 到 有 一 个 数据 报 
已 准备 好 被 读 入 ， 于 是 它 fork 并 exec 程 序 /usr/lib/netsvc/rstat/rpc.rstatd ° 
在 fork 和 exec 之 间 ， 该 服务 器 的 XTI 端 点 被 复制 到 描述 符 0、1 和 2 上 ， 
inetd 的 所 有 其 他 描述 符 则 都 被 关闭 (UNPv1 的 图 12-7 [7] ) 。inetd 还 将 
停止 监听 发 往 该 XTI 端 点 的 新 的 客户 请 求 ， 直 到 当前 这 次 服务 器 激活 


( 它 是 inetd 的 一 个 子 进程 ;终止 为 止 ， 这 是 因为 该 服务 器 在 配置 文件 

中 指定 了 wait 属 性 的 缘故 。 

假设 该 程序 是 由 rpcgen 产 生 的 ， 它 将 检测 到 标准 输入 是 一 个 XTI 端 
点 ， 于 是 相应 地 把 该 端点 初始 化 为 一 个 RPC 服 务 右 端点 。 这 是 通过 调 
用 RPC 函 数 svc_tli_create 和 svc_reg 完 成 的 ， 我 们 不 再 讨论 它们 。 第 二 个 
函数 并 不 同 端口 映射 器 登记 本 服务 右 ， 这 步 工 作 只 由 inetd 在 启动 时 做 
一 次 。 该 RPC 服 务 辟 接 痢 进入 循环 ， 由 名 为 svc_run 的 函数 读 入 竺 处 理 
的 数据 报 ， 并 调用 相应 的 服务 器 过 程 来 处 理 这 个 客户 请 求 。 

通常 情况 下 ， 由 inetd 激 活 的 服务 絮 处 理 完 一 个 客户 请 求 后 就 终 
止 ， 以 此 允许 inetd 等 待 下 一 个 客户 请 求 。 作 为 一 种 优化 手段 ， 由 rpcgen 
产生 的 RPC 服 务 器 会 等 待 一 小 段 时 间 (默认 值 为 2 分 钟 ，， 以 防 另 一 个 
客户 请 求 在 这 段 时 间 内 到 达 。 如 果真 是 这 样 ， 这 个 已 经 在 运行 的 现 有 
服务 器 将 读 入 新 的 数据 报 并 处 理 其 请 求 。 这 就 避免 了 给 短 时 间 内 相继 
到 达 的 多 个 客户 请 求 分 别 执行 一 次 forkk 和 一 次 exec 的 开销 。 过 了 这 上段 小 
的 等 竺 期 后 ， 服 务 器 将 终止 。 这 将 给 inetd 产 生 一 个 SIGCHLD 信 号 ， 从 
而 导致 它 再 次 开始 查看 该 XTI 端 点 上 有 无 数据 报到 达 。 


16.4 认证 


默认 情况 下 ，RPC 请 求 中 没有 标识 客户 的 信息 。 服 务 器 回答 客户 
的 请 求 时 并 不 关心 客户 是 谁 。 这 称 为 空 认证 (null authentication) 或 
AUTH NONE ? 

下 一 个 认证 级 别称 为 Unix 认证 ( Unix authentication) 或 
AUTH_SYS。 客 户 必 须 告诉 RPC 运 行 时 系统 随 每 个 请 求 携 市 其 身份 信 
EB 〈 主 机 和 名、 有效 用户 ID、 有 效 组 ID 和 可 能 多 个 辅助 组 ID) 。 我 们 把 
16.2 下 中 的 客户 -服务 器 程序 修改 成 包括 Unix 认 证 。 图 16-10 给 出 了 其 中 
的 客户 程序 。12 一 13 这 两 行 是 新 的 。 我 们 首先 调用 auth_destroy 销 毁 与 


本 客户 句柄 关联 的 先前 的 认证 ， 也 就 是 默认 创建 的 空 认 证 。 然 后 调用 
函数 authsys_create_default 创 建 相 应 的 Unix 认 证 结构 ， 并 把 该 结构 存 入 


客户 句柄 CLIENT 结构 的 cl_auth 成 员 中 
的 一 样 。 


。 客户 程序 的 其 余部 分 与 图 16-7 


sunrpc/square4/client.c 


1 #include "unpipc.h" 

2 #include "Square .hn 

3 int 

4 main(int argc, char **argv) 
5 { 


6 CLIENT *cl; 
7 square_in in; 
8 Square out out; 


9 if (argc l= 3) 
10 err quit("usage: client «hostname» <integer-value>") ; 
1l cl - Clnt create(argv[1], SQUARE PROG, SQUARE VERS, "tcp"); 
12 auth destroy(cl-»cl auth); 
13 Cl-»cl auth = authsys create default(); 
14 in.argl = atol(argv[2]); 
15 if (squareproc 2(&in, &out, cl) !- RPC SUCCESS) 
16 err quit("$s", clnt sperror(cl, argv[1])); 
T7 printf("result: $1dWMn", out.res1); 
18 exit (0); 
19 } 


图 16-10 提供 Unix 认 订 


sunrpc/square4/client.c 


E 的 客户 程序 


图 16-11 给 出 了 新 的 服务 器 过 程 ， 它 从 图 16-8 修 改 而 来 。 我 们 没有 
给 出 square_prog_2_freeresult 函 数 ， 它 没有 变动 。 


sunrpc/square4/server.c 


1 #include "unpipc.h" 
2 #include "square.h" 
3 bool t 


4 squareproc 2 svc(square in *inp, square out *outp, struct svc req *rqstp) 


6 printf ("thread $1d started, arg = %ld, auth = %d\n", 

7 pr thread id(NULL), inp->argl, rqstp-»rq cred.oa flavor); 
8 if (rqstp-»rq cred.oa flavor -- AUTH SYS) ( 

9 struct authsys parms *au; 


10 au = (struct authsys parms *)rgstp-»rq clntcred; 

11 printf("AUTH SYS: host %s, uid $1d, gid %ld\n", 

12 au-»aup machname, (long) au-»aup uid, (long) au-»aup gid); 
13 } 

14 sleep (5) ; 

15 outp-»resl = inp->argl * inp->argl; 

16 printf ("thread $1d done\n", pr_thread_id(NULL) ) ; 

17 return (TRUE) ; 

18 } 


sunrpc/square4/server.c 


图 16-11 寻找 Unix 认 证 的 服务 器 过 程 
6--8 现在 使 用 一 个 指 同 svc_req 结 构 的 指针 ， 它 总 是 作为 一 个 参数 
传递 给 服务 絮 过 程 。 


struct svc_req { 


u_long rq prog; /* program number */ 

u long rq vers; /* version number */ 

u long rq proc; /* procedure number */ 

struct opaque auth rq cred; /* raw credentials */ 

caddr t rq cintcred; /* cooked credentials 
(read-only)*/ 

SVCXPRT *rq xprt; /* transport handle 


d 
js 
struct opaque auth { 
enum t oa flavor; /* flavor: AUTH xxx constant */ 


caddr t oa base; /* address of more auth stuff */ 


u int oa length; /* not to exceed MAX AUTH BYTES 
*/ 

}; 

其 中 rq_cred 成 员 含 有 原始 认证 信息 ， 它 的 0a_flavor 成 员 是 一 个 标识 
认证 类 型 的 整数 。“ 原 始 (raw) ”一 词 意味 着 RPC 运 行 时 系统 没有 处 理 
由 oa_base 指 癌 的 信息 。 然 而 ， 如 有 果 是 运行 时 系统 文 持 的 认证 类 型 的 
话 ， 那 么 由 rq_clntcred 指 向 的 成 就 (cooked) 凭证 已 被 运行 时 系统 处 理 
成 某 个 适合 那 种 认证 类 型 的 结构 。 我 们 输出 认证 类 型 ， 并 检查 它 是 否 
等 于 AUTH_ SYS ° 

9~12 对 于 Unix 认 证 ， 指 向 成 熟 任 证 的 指针 (rq_clntcred) 所 指 的 

是 含有 客户 身份 的 一 个 authsys_parma 结 构 : 


struct authsys_parms { 


u long aup time; /* credentials creation time */ 

char *aup machname;/* hostname where client is located */ 
uid t aup uid; /* effective user ID */ 

gid t aup gid; /* effective group ID */ 

u int aup len; /* #elements in aup. gids[] */ 


gid t *aup_gids; /* supplementary group IDs */ 

js 

我 们 取得 指向 这 个 结构 的 指针 后 ， 输 出 客户 的 主机 名 、 有 效用 户 
ID 和 有 效 组 ID ° 

局 动 我 们 的 服务 右 ， 然 后 运行 客户 程序 一 次 ， 我 们 从 服务 器 得 到 
如 下 的 输出 : 

solaris % server 

thread 1 started,arg = 44,auth = 1 

AUTH SYS: host solaris.kohala.com,uid 765,gid 870 

thread 1 done 


Unix 认 证 很 少 使 用 ， 因 为 它 极 易 被 攻破 。 我 们 可 以 很 容易 地 目 行 
构造 舍 有 Unix 认 证 信息 的 RPC 分 组 ， 把 其 中 的 用 户 ID 和 组 ID 设置 成 我 
们 想 要 的 任何 值 ， 然 后 发 送 给 服务 器 。 服 务 器 没有 办 法 验证 我 们 就 是 
所 声称 的 客户 。 

实际 上 NFS 默 认 使 用 Unix 认 证 ， 然 而 NFS 请 求 通常 是 由 NFS 客 户主 
机 的 内 核发 出 的 ， 而 且 通 常 使 用 一 个 保留 端口 (UNPvIBJ2.7 5) 。 有 
些 NFS 服 务 器 配置 成 只 响应 从 一 个 保留 端口 到 达 的 客户 请 求 。 如 果 你 信 
任 想 要 往 其 上 安装 你 的 文件 系统 的 客户 主机 ， 那 么 你 也 在 信任 该 客户 
主机 的 内 核能 正确 地 标识 自己 的 用 户 。 要 是 服务 器 不 要 求 客 户 使 用 一 
个 保留 端口 ， 黑 客 们 就 能 够 自行 编写 出 向 NFS 服 务 器 发 送 NFS 请 求 的 程 
序 ， 其 中 的 Unix 认 证 ID 可 设置 成 任意 想 要 的 值 。 即 使 服务 器 要 求 客户 
使 用 一 个 保留 端口 ， 如 果 你 拥有 一 个 自己 具有 超级 用 户 特权 的 系统 ， 
而 且 你 能 够 把 自己 的 系统 接 入 网 络 中 ， 那 么 你 仍 可 以 向 服务 器 发 送 自 
己 的 NFS 请 求 。 

不 论 是 请 求 还 是 应 答 ， 一 个 RPC 分 组 中 实际 都 含有 两 个 与 认证 相 
关 的 字段 : SEUE (credential) 和 验证 器 (verifier) (116-3041 4 16- 
32) 。 一 个 常用 的 类 比 是 带 相 片 的 身份 证 件 〈 护 照 、 轰 驶 执照 等 ) 。 
凭证 是 印 制 的 信息 (姓名 、 住 址 、 出 生日 期 等 ) ， 验 证 器 则 是 相片 。 
验证 器 还 有 其 他 的 形式 ， 不 过 相片 的 效果 要 比 列 出 身高 、 体 重 、 人 性 别 
等 更 好 。 如 果 我 们 有 一 个 没有 任何 形式 的 识别 信息 的 身份 证 件 (图 书 
馆 借 书 卡 往往 是 这 样 的 例子 ) ， 那 么 我 们 是 光 有 和 凭证 而 没有 验证 器 ， 
因而 任何 人 都 可 以 使 用 它 并 声称 是 它 的 主人 。 

在 空 认证 的 情况 下 ， 和 凭证 和 验证 器 都 是 空 的 。 使 用 Unix 认 证 时 ， 
凭证 中 含有 主机 名 、 用 户 ID 和 组 ID， 但 是 验证 器 是 空 的 。RPC 还 支持 
其 他 形式 的 认证 ， 它 们 的 和 赁 证 和 验证 器 含有 的 信息 也 不 一 样 。 

AUTH SHORT 另 一 种 形式 的 Unix 认 证 ， 在 从 服务 器 返回 客户 的 
RPC 应 答 的 验证 器 字段 中 发 送 。 它 的 信息 量 比 完整 的 Unix 认 证 少 ， 而 


且 客 户 可 以 在 后 续 的 请 求 中 把 它 作为 凭证 发 送 回 服务 器 。 这 种 认证 类 
型 的 意图 在 于 节省 网 络 带宽 和 服务 器 主机 的 CPU 时 间 。 

AUTH DES DES 是 数据 加 密 标准 (Data Encryption Standard) 的 首 
字母 缩写 ， 这 种 认证 形式 基于 私 铀 和 公 钥 加 密 机 制 。 这 种 方案 也 称 为 
安全 的 RPC (secure RPC) ， 当 用 作 NFS 的 基础 时 ， 这 样 的 NFS 称 为 安 
全 的 NFS (secure NFS) 。 

AUTH_KERB 这 种 方案 基于 MIT 的 Kerberos 认 证 系统 。 

| Garfinkel and Spafford 1996| 第 19 章 详细 讨论 了 后 两 种 形式 的 认 
W, 包括 它们 的 设置 和 使 用 。 


16.5 超时 和 重 传 


现在 查看 Sun RPC 使 用 的 超时 和 重 传 策 略 。Sun RPC 使 用 了 两 个 超 
时 值 。 

(总 超时 (total timeout) : 一 个 客户 等 待 其 服务 器 的 应 答 的 总 时 
间 量 。TCP 和 UDP 都 使 用 该 值 。 

(2) 重 试 超时 (retry timeout) : 只 用 于 UDP， 是 一 个 客户 在 等 待 其 
服务 器 的 应 管 期 间 每 次 重 传 请 求 的 间隔 时 间 。 

首先 应 注意 使 用 TCP 不 需要 重 试 超时， 因为 TCP 是 一 个 可 靠 的 协 
议 。 如 果 服 务 絮 主机 没有 接收 到 客户 的 请 求 ， 客 户主 机 的 TCP 就 会 超时 
并 重 传 该 请 求 。 当 服务 器 主机 接收 到 客户 的 请 求 时 ， 服 务 器 主机 的 TCP 
会 同 客 户主 机 的 TCP 确 认 这 次 收 到 。 如 果 服 务 颖 的 确认 是 数据 丢失 ， 导 
致 客户 主机 的 TCP 重 传 该 请 求 ， 那 么 当 服 务 絮 主机 的 TCP 接 收 到 这 个 重 
复 的 数据 时 ， 它 将 丢弃 该 数据 ， 并 再 次 发 出 一 个 确认 。 有 了 可 靠 的 协 
议 后 ， 可 靠 性 (超时 、 重 传 、 对 重复 数据 或 重复 确认 的 处 理 ) 就 由 传 
输 层 提供 ，RPC 运 行 时 系统 不 再 天 心 它 。 由 客户 主机 RPC 层 发 出 的 一 个 
请 求 将 由 服务 器 主机 RPC 层 作为 一 个 请 求 接 收 (如 有 果 这 个 请 求 从 未 得 


到 过 确认 ， 那 么 客户 主机 RPC 层 将 得 到 一 个 出 错 指 示 ) ， 而 不 管 在 网 
络 层 和 传输 层 上 发 生 什么 。 

创建 一 个 客户 句柄 后 ， 我 们 可 以 调用 clnt_control 查 询 或 设置 影响 该 
句柄 的 选项 。 这 类 似 于 给 一 个 描述 符 调 用 fcntl， 或 者 给 一 个 套 接 字 调用 
getsockopt 和 setsockopt ° 

#include <rpc/rpc.h> 

bool_t clnt_control(CLIENT *cl,unsigned int request,char *ptr); 

返回 : 若 成 功 则 为 TRUE， 若 出 错 则 为 FALSE 

其 中 dl 症 客户 句柄 ， 由 ptr 指 癌 的 内 容 则 取决 于 request 。 

我 们 把 图 16-2 给 出 的 客户 程序 修改 为 调用 该 函数 并 输出 RPC 的 两 个 
超时 值 。 图 16-12 给 出 了 这 个 新 的 客户 程序 。 


sunrpc/square5/client.c 


1 #include "unpipc.h" 
2 #include "Square.h" 
3 int 


4 main(int argc, char **argv) 


6 CLIENT *cl; 
y square in in; 
8 Square out *outp; 
9 struct timeval tv; 
10 if (argc !- 4) 
11 err quit ("usage: client «hostname» <integer-value> «protocol»"); 
12 cl = Clnt create(argv[1], SQUARE PROG, SQUARE VERS, argv[3]); 
13 Clnt control(cl, CLGET TIMEOUT, (char *) &tv); 
14 printf ("timeout = %ld sec, $1d usec\n", tv.tv sec, tv.tv usec); 
15 if (clnt control(cl, CLGET RETRY TIMEOUT, (char *) &tv) -- TRUE) 
16 printf("retry timeout = $1d sec, $1d usec\n", tv.tv sec, tv.tv usec); 
I7 in.argl = atol(argv[2]); 
18 if ( (outp = squareproc_1(&in, cl)) == NULL) 
19 err quit("$s", clnt sperror(cl, argv[11)); 
20 printf("result: %ld\n", outp-»res1); 
21 exit (0); 
22 } 


sunrpc/square5/client.c 


图 16-12 查询 并 输出 两 个 RPC 超 时 值 的 客户 程序 
协议 是 一 个 命令 行 选项 


10 一 12 现在 作为 另 一 个 命令 行 选 项 来 指定 协议 ， 并 把 它 用 作 
clnt_create 的 最 后 一 个 参数 。 

取得 总 超时 

13-14 clnt_control 的 第 一 个 参数 是 客户 句柄 ， 第 二 个 参数 是 请 
求 ， 第 三 个 参数 则 通常 是 指向 一 个 缓冲 区 的 指针 。 我 们 的 第 一 个 请 求 
是 CLGET_TIMEOUT， 它 在 其 地 址 为 第 三 个 参数 的 timeval 结 构 中 返回 
总 超时 值 。 该 请 求 对 所 有 协议 都 有 效 。 

党 试 取得 重 试 超时 

15 一 16 我 们 的 下 一 个 请 求 是 获取 重 试 超时 的 
CLGET_RETRY_TIMEOUT， 不 过 这 个 超时 只 对 UDP 有 效 。 因 此 ， 如 
果 返 回 值 为 FALSE， 我 们 就 什么 都 不 输出 。 

我 们 还 把 图 16-6 给 出 的 服务 器 程序 修改 为 睡眠 1000 秒 而 不 是 5 秒 ， 
以 保证 客户 的 请 求 超时 。 在 主机 bsdi 上 启动 服务 器 后 运行 客户 程序 两 
次 ， 一 次 指定 TCP 协 议 ， 一 次 指定 UDP 协议 ， 然 而 结果 并 不 是 我 们 所 预 
期 的 : 

solaris % date ; client bsdi 44 tcp ; date 

Web Apr 22 14:46:57 MST 1998 


timeout = 30 sec,0 usec BE] (Be 308) 

bsdi: RPC: Timed out 

Web Apr 22 14:47:22 MST 1998 但 这 是 在 25 秒 后 
输出 的 


solaris % date ; client bsdi 55 udp ; date 

Web Apr 22 14:48:05 MST 1998 

timeout = -1 sec,-1 usec ay pe 

retry timeout = 15 sec,0 usec 这 倒是 正确 的 

bsdi: RPC: Timed out 

Web Apr 22 14:48:31 MST 1998 大 约 25 秒 之 后 


在 使 用 TCP 的 情况 下 ， 由 cntl_control 返 回 的 总 超时 值 为 30 秒 ， 但 是 
我 们 的 测量 给 出 一 个 25 秒 的 超时 值 。 人 至 于 使 用 UDP 的 情况 ， 所 返回 的 
尽 超 时 值 为 -1 © 

为 查看 究竟 发 生 了 什么 ， 我 们 分 析 由 rpcgen 产 生 的 客户 程序 存根 文 
件 square_clint.c 中 的 squareproc_1 函 数 。 该 函数 调用 clnt_call， 传 递 给 它 
的 最 后 一 个 参数 是 名 为 TIMEOUT 的 一 个 timeval 结 构 ， 这 个 变量 在 该 文 
件 中 声明 ， 它 的 初始 值 为 25 秒 。 传 递 给 clnt_call 的 这 个 参数 覆 亩 了 用 于 
TCP 的 30 秒 默认 超时 值 和 用 于 UDP 的 默认 值 -1。 这 个 参数 一 直 沿 用 到 客 
户 以 一 个 CLSET_TIMEOUT 请 求 调用 clnt_control 显 式 地 设置 总 超时 值 
为 止 。 如 采 我 们 想 改变 总 超时 值 ， 那 就 应 该 调用 clnt_control， 而 不 应 该 
修改 客户 程序 存根 中 的 timeval 结 构 变 量 TIMEOUT 。 

验证 UDP 重 试 超时 的 唯一 办 法 古 使 用 tcpdump 观 察 分 组 。 这 种 观察 
表明 ， 第 一 个 数据 报 是 在 客户 一 局 动 后 就 发 送 的 ， 下 一 个 数据 报 的 发 
送 则 在 约 15 秒 之 后 。 

16.5.1 TCP 连 接管 理 

使 用 tcpdump 观 察 刚 才 描 述 的 客户 -服务 器 程序 的 运行 情况 ， 我 们 首 
和 完 看 到 TCP 的 三 路 握手 ， 然 后 是 客户 发 送 其 请 求 ， 服 务 句 确认 这 个 请 
求 。 大 约 25 秒 后 ， 客 户 发 送 一 个 FIN 分 节 ， 它 是 由 客户 进程 即将 终止 引 
起 的 ， 接 着 是 TCP 连 接 终 止 序列 的 其 余 三 个 分 玫 。UNPv1 的 2.5 世 详细 
VE [308545 T o 

我 们 想 要 展示 Sun RPC 在 使 用 TCP 连 接 上 的 以 下 特征 : 客户 通过 调 
用 clnt_create 建 立 一 个 新 的 TCP 连 接 ， 这 个 连接 由 与 所 指定 的 程序 和 版 
本 相关 联 的 所 有 过 程 调用 来 使 用 。 一 个 客户 的 TCP 连 接 或 者 通过 调用 
clnt_destroy 显 式 地 终止 ,或 者 由 客户 进程 的 终止 隐 式 地 终止 。 

#include <rpc/rpc.h> 

void clnt_destroy(CLIENT *cl); 


我 们 从 图 16-2 的 客户 程序 着 手 ， 把 它 修改 成 调用 服务 器 过 程 两 次 ， 
然后 调用 clnt_destroy， 接 着 pause。 图 16-13 给 出 了 这 个 新 的 客户 程序 。 


sunrpc/square9/client.c 


1 #include "unpipc.h" /* our header */ 

2 #include "Square.h" /* generated by rpcgen */ 
3 int 

4 main(int argc, char **argv) 

5 


6 CLIENT *cl; 
7 Square in in; 
8 Square out *outp; 


9 if (argc != 3) 
10 err quit("usage: client «hostname» «integer-value»"); 
TT cl - Clnt create(argv[1], SQUARE PROG, SQUARE VERS, "tcp"); 
12 in.argl = atol(argv[2]); 
13 if ( (outp = squareproc_1(&in, cl)) == NULL) 
14 err quit("$s", clnt sperror(cl, argv[11)); 
15 printf("result: $1dWMn", outp->res1) ; 
16 in.argl *- 2; 
17 if ( (outp = squareproc_1(&in, cl)) == NULL) 
18 err quit("$s", clnt sperror(cl, argv[1])); 
19 printf("result: $1dWMn", outp-»res1); 
20 clnt destroy (cl); 
21 pause () ; 
22 exit (0); 
23 } 


sunrpc/square9/client.c 


图 16-13 检查 TCP 连 接 使 用 情况 的 客户 程序 
运行 这 个 程序 得 到 了 预期 的 输出 : 


solaris % client kalae 5 


result: 25 
result: 100 
程序 只 是 等 待 ， 直 到 我 们 杀 死 它 为 目 
不 过 验证 我 们 后 移 给 出 的 声明 只 能 通过 观察 tctpdump 的 输出 。 这 个 
输出 表明 ， 有 一 个 TCP 连 接 被 创建 了 〈 通 过 调用 clnt_create) ， 而 且 两 
个 客户 请 求 都 使 用 这 个 连接 。 该 连接 然后 由 clnt_destroy 调 用 终止 ， 尽 
管 当 时 客户 进程 还 没有 终止 。 


16.5.2 事务 ID 

超时 和 重 传 策略 的 另 一 部 分 是 使 用 事务 ID (transaction ID) 即 XID 
来 标识 客户 请 求 和 服务 器 应 答 的 。 当 一 个 客户 发 出 一 个 RPC 调 用 时 ， 
RPC 运 行 时 系统 给 这 个 调用 赋 一 个 32 位 整数 XID ， 该 值 伴随 RPC 消 息 发 
送 。 服 务 器 必须 伴随 其 应 答 返 回 这 个 XID。RPC 运 行 时 系统 重 传 一 个 请 
求 时 ， XID 并 不 改变 。 使 用 XID 的 目的 有 两 个 。 

(客户 验证 应 答 的 XID 等 于 早先 随 请 求 发 送 的 XID ， 否 则 的 话 客户 
忽略 这 个 应 答 。 如 条 使 用 的 是 TCP 协 议 ， 那 么 客户 收 到 XID 不 正确 的 应 
答 的 机 会 非常 罕见 ， 然 而 如 果 使 用 的 是 UDP 协 议 ， 而且 存 在 重 传 请 求 
的 可 能 ， 网 络 也 易于 丢失 分 组 ， 那 么 接收 到 XID 不 正确 的 应 答 是 绝对 可 
能 的 。 

(2) 服 务 器 允许 维护 一 个 存放 已 发 送 应 答 的 高 速 缓存 (cache) ， 而 
用 于 确定 一 个 请 求 是 否 为 一 个 重复 请 求 的 条 目 之 一 是 XID。 我 们 稍 后 讨 
论 这 个 高 速 缓存 。 

TI. RPC 软 件 包 使 用 以 下 算法 来 给 一 个 新 请 求 选 择 一 个 XID ， 其 中 ^ 
运算 符 是 C 的 按 位 异 或 : 

struct timeval now; 

gettimeofday(&now,NULL); 

xid = getpid()^ now.tv sec ^ now.tv usec; 

16.5.3 服务 器 重复 请 求 高 速 缓存 

为 使 能 RPC 运 行 时 系统 维护 一 个 重复 请 求 高 速 缓存 ， 服 务 器 必须 
调用 svc_dg_enablecache。 一 旦 启用 了 这 个 高 速 缓存 ， 就 没有 办 法 天 掉 
E 《除非 服务 器 进程 终止 ) 


#include <rpc/rpc.h> 


int svc_dg_enablecache(SVCXPRT *xprt,unsigned long size); 
返回 : ERDUK, Æ BEA- 


其 中 xprt 是 一 个 传输 句柄 ， 该 指针 是 svc_req 结 构 的 一 个 成 员 (16.4 
T) 。 而 该 结构 的 地 址 是 作为 一 个 参数 传递 给 服务 器 过 程 的 。size 是 需 
为 之 分 配 内 存 空间 的 高 速 缓存 项 数 。 

启用 该 高 速 缓存 后 ， 服 务 器 便 为 它 所 发 送 的 全 部 应 答 维 护 一 个 
FIFO (先进 先 出 ) 高 速 缓存 。 每 个 应 答 是 由 如 下 信息 唯一 标识 的 : 

程序 号 ; 

版 本 号 ; 

wes; 

XID; 

客户 地 址 〈IP 地 址 和 UDP 端口 号 ) 。 

每 当 服务 器 中 的 RPC 运 行 时 系统 接收 到 一 个 客户 请 求 时 ， 首 先 会 
搜索 重复 请 求 高 速 缓存 ， 看 其 中 是 否 已 有 该 请 求 的 一 个 应 答 。 如 果 有 
的 话 ， 这 个 高 速 缓存 的 应 答 就 返回 给 客户 ， 而 不 再 调用 相应 的 服务 器 
过 程 。 

重复 请 求 高 速 缓存 的 目的 是 : 当 接 收 到 对 某 个 服务 器 过 程 的 多 个 
重复 请 求 时 ， 避 免 多 次 调用 该 服务 器 过 程 ， 因 为 该 过 程 也 许 不 是 等 势 
的 。 在 网 络 中 接收 到 重复 请 求 的 可 能 原因 是 应 答 丢 失 或 者 客户 重 传 请 
求 超前 于 应 答 的 接收 。 注 意 ， 这 种 重复 请 求 高 速 缓存 只 适用 于 像 UDP 
这 样 的 数据 报 协 议 ， 因 为 使 用 TCP 协 议 时 应 用 绝对 看 不 到 重复 的 请 求 ， 
请 求 的 重复 问题 是 由 TCP 处 理 的 〈 见 习题 16.6) 。 


16.6 调用 语义 


在 图 15-29 给 出 的 门客 户 程序 中 ， 当 客户 的 door_call 调 用 被 一 个 捕 
获 的 信号 所 中 断 时 ， 客 户 辐 服务 疹 重 传 其 请 求 。 然 而 我 们 接 下 去 展示 
出 这 将 导致 相应 的 服务 右 过 程 被 调用 两 次 ， 而 不 是 一 次 。 我 们 随后 把 


服务 器 过 程 划 分 成 等 势 (能够 任意 多 次 无 差错 地 调用 ) 和 非 等 势 Cf] 
如 从 某 个 银行 账户 上 减 去 一 笔 费用 ) 两 大 类 。 

过 程 调 用 可 划分 成 以 下 三 个 类 别 。 

(1) 正 好 一 次 (exactly once) : 过 程 只 能 不 多 不 少 地 执行 一 次 。 这 
类 操作 难于 实现 ， 因 为 服 

Fan FTE ABTA RT BÉ ° 

(2) 最 多 一 次 (at most once) : 过 程 根本 不 执行 或 只 执行 一 次 。 如 
果 正 常 地 返回 到 调用 者 ， 我 们 就 知道 该 过 程 执行 了 一 次 。 然 而 如 果 是 
出 错 返 回 ， 我 们 就 不 能 肯定 该 过 程 执 行 了 一 次 还 是 根本 没有 执行 。 

(3) 最 少 一 次 (atleast once) : 过 程 至 少 执行 一 次 ， 不 过 有 可 能 是 
多 次 。 这 对 于 等 势 过 程 没 有 问题 ， 客 户 只 需 一 直 传 送 其 请 求 ， 直 到 接 
收 到 一 个 有 效 的 啊 应 为 止 。 然 而 如 采 客 户 非 得 不 止 一 次 地 发 送 其 请 求 
以 接收 一 个 有 效 的 啊 应 ， 那 么 该 过 程 执 行 一 次 以 上 的 可 能 是 存在 的 。 

对 于 一 个 本 地 过 程 调 用 ， 如 果 它 返回 ， 我 们 就 知道 它 正 好 执行 了 
一 次 ， 但 是 如 果 当 前 进程 在 调用 该 过 程 后 月 浇 ， 我 们 就 不 知道 它 到 奈 
执行 了 一 次 还 是 根本 没有 执行 。 对 于 一 个 远程 过 程 调用 ， 我 们 必须 考 
虑 如 下 各 种 情形 。 

如 果 使 用 的 是 TCP 协 议 ， 而 且 接 收 到 了 一 个 应 答 ， 我 们 就 知道 该 远 
程 过 程 正 好 被 调用 了 一 次 。 但 是 如 果 没 有 接收 到 应 答 ( 壁 如 说 服务 颖 
主机 前 溃 了 ) ， 我 们 就 不 知道 该 服务 器 过 程 已 在 其 主机 裔 误 之 前 执行 
完毕 ， 还 是 尚未 被 调用 (最 多 一 次 的 语义 ) 。 在 服务 器 主机 可 能 月 
滥 ， 而 且 网 络 存在 停止 运作 可 能 的 前 提 下 ， 提 供 正 好 一 次 的 语义 需要 
一 个 事务 处 理 系统 ， 它 已 超出 了 RPC 软 件 包 的 能 

如 果 使 用 的 是 UDP 协 议 ， 而 且 服 务 右 主机 没有 月 江 ， 应 管 也 接收 
到 了 ， 我 们 就 知道 该 服务 右 过 程 至 少 被 调用 了 一 次 ， 不 过 也 可 能 是 多 
次 (最少 一 次 语义 ) e 


如 果 使 用 的 是 UDP 协议 ， 而 且 启 用 了 一 个 服务 器 高 速 缓存 ， 应 答 
也 接收 到 了 ， 我 们 就 知道 该 服务 器 过 程 正好 被 调用 了 一 次 。 然 而 如 果 
没有 接收 到 应 答 ， 那 承 具 有 最 多 一 次 的 语义 ， 这 跟 TCP 情 形 类 似 。 

给 定 如 下 三 种 选择 : 

(1)TCP; 


(2)UDP， 带 有 一 个 服务 器 高 速 缓存 ; 
(3)UDP， 没 有 任何 服务 器 高 速 缓存 。 


我 们 的 建议 如 下 所 述 。 

总 是 使 用 TCP， 除 非 TCP 连 接 的 开销 对 于 应 用 来 说 过 分 昂贵 。 

给 正确 执行 的 意义 相当 重大 的 非 等 势 过 程 (例如 银行 账户 、 机 票 
预订 等 ) 使 用 一 个 事务 处 理 系统 。 

对 于 非 等 势 过 程 ， 使 用 TCP 要 比 使 用 带 有 一 个 服务 器 高 速 缓存 的 
UDP 更 为 可 取 。TCP 一 开始 束 设 计 成 可 靠 的 ， 而 往 一 个 UDP 应 用 中 添加 
可 靠 性 很 少 能 达到 使 用 TCP 的 效果 〈 例 如 UNPv1 的 20.5 闻 ) 。 

对 等 势 过 程 使 用 不 带 服务 器 高 速 缓存 的 UDP 不 成 问题 。 

? 对 非 等 势 过 程 使 用 不 带 服务 器 高 速 缓存 的 UDP 则 是 危险 的 。 

我 们 将 在 下 一 节 讨 论 使 用 TCP 的 其 他 优势 。 


16.7 H 入 过 早 终止 


现在 考虑 客户 或 服务 器 之 一 过 早 终止 ， 而 且 使 用 TCP 作 为 传输 协议 
时 会 发 生 什 么 情况 。 既 然 UDP 是 无 连接 的 ， 因 而 打开 看 某 个 UDP 端点 
的 一 个 进程 终止 时 ， 不 会 有 任何 信息 发 送 给 对 方 。 在 使 用 UDP 的 情形 
PB. SARA EMS aA: 对 方 将 超时 ， 可 能 会 重 
传 ， 最 终 放弃 ， 这 是 上 一 节 中 讨论 过 的 。 然 而 ， 当 具有 某 个 打开 着 的 
TCP 连 接 的 一 个 进程 终止 时 ， 该 连接 也 终止 ， 从 而 同 对 方 发 送 一 个 FIN 


分 节 (UNPv1 第 36~37 页 ) ， 我 们 就 想 看 一 看 当 RPC 运 行 时 系统 在 接 
收 到 来 自 对 方 的 这 个 出 乎 意料 的 FIN 时 会 做 些 什 么 。 

16.7.1 服务 器 的 过 早 终止 

我 们 首先 在 服务 器 仍 在 处 理 一 个 客户 请 求 时 过 早 地 终止 它 。 对 客 
户 程序 所 作 的 唯一 变动 是 : 把 图 16-2 中 clnt_create 调 用 的 “tcp” 参 数 挪 
走 ， 改 成 作为 一 个 命令 行 参 数 指定 所 用 的 传输 协议 ， 就 像 图 16-12 中 的 
那样 。 在 服务 器 过 程 中 ， 我 们 增加 一 个 abort 函 数 调用 。 该 调用 会 终止 
服务 器 进程 ， 导 致 服务 器 主机 的 TCP 向 客户 主机 的 TCP 发 送 一 个 FIN， 

一 点 可 使 用 tcpdump 验 证 。 

Jl] FEM BSD/OS Kt E BS ARH 8832 11 Solaris Kt LW FP 

FF: 


solaris % client bsdi 22 tcp 


bsdi: RPC: Unable to receive; An event requires attention 

当 客 户主 机 接收 到 服务 器 主机 的 FIN 时 ， 其 RPC 运 行 时 系统 正在 等 
竺 服务 器 的 应 答 。 它 检测 到 这 个 非 预期 的 应 答 后 ， 从 我 们 的 
squareproc_1 调 用 返回 一 个 错误 。 该 错误 (RPC CANTRECV) 由 运行 
时 系统 保存 在 客户 句柄 中 ， (从 我 们 的 Clnt_create 包 于 函数 中 ) 调用 
clnt_sperror 将 把 该 错误 输出 成 “Unable to receive (无 法 接收 ) ”。 该 出 错 
消息 的 其 余部 分 “Anevent requires attention (有 一 个 事件 需要 留意 ) ”对 
应 于 由 运行 时 系统 你 存 的 XTI 错 误 ， 它 也 由 clnt_sperror 输 出 。 一 个 客户 
调用 一 个 远程 过 程 时 能 够 返回 大 约 30 个 不 同 的 RPC_xxx 错 误 ， 它 们 列 
在 <rpc/clnt_starh> 头 文件 中 。 

对 换 客 户 和 服务 絮 的 运行 主机 ， 我 们 看 到 同样 的 情形 ， 由 RPC 运 
行 时 系统 返回 同样 的 错误 (RPC CANTRECV) ， 不 过 最 后 输出 的 消息 
不 一 样 。 


bsdi % client solaris 11 tcp 


solaris: RPC: Unable to receive; errno = Connection reset by peer 


上 面 我 们 中 止 的 Solaris 服 务 顺 不 是 作为 一 个 多 线程 化 的 服务 器 程序 
编译 的 ， 因 此 当 我 们 调用 abort 时 ， 整 个 进程 被 终止 。 如 时 我 们 运行 一 
个 多 线程 化 的 服务 器 程序 ， 事 情 就 有 变化 ， 也 就 是 说 只 有 为 客户 的 调 
用 提供 服务 的 线程 才 终 止 。 为 迫使 这 种 情形 出 现 ， 我 们 把 abort 调 用 和 琴 
换 成 pthread_exit 调 用 ， 束 像 我 们 在 图 15-25 中 对 使 用 门 的 例子 所 做 的 那 
样 。 然 后 在 BSD/OS 系 统 上 运行 客户 程序 ， 在 Solaris 系 统 上 运行 多 线程 
化 的 服务 器 程序 。 


bsdi % client solaris 33 tcp 


solaris: RPC: Timed out 

当 服 务 器 线程 终止 时 ， 与 客户 的 TCP 连 接 并 未 关闭 ， 也 就 是 说 它 仍 
然 在 服务 器 进程 中 保持 打开 。 因 此 ， 服 务 器 主机 没有 给 客户 发 送 FIN， 
于 是 客户 仅仅 超时 。 在 客户 请 求 已 发 送 给 服务 器 ， 并 且 服 务 器 主机 的 
TCP 已 确认 该 请 求 后 ， 如 果 服 务 句 主机 裔 浇 ， 那 么 我 们 将 看 到 同样 的 情 
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16.7.2 客户 的 过 早 终止 

当 一 个 RPC 客 户 在 其 使 用 TCP 的 某 个 RPC 过 程 调 用 仍 在 进展 期 间 终 
止 时 ， 客 户主 机 的 TCP 将 辣 服务 器 主机 的 TCP 发 送 一 个 FIN。 我 们 的 问 
题 是 : 服务 妖 的 RPC 运 行 时 系统 是 否 检 测 到 了 这 个 条 件 ， 从 而 可 能 后 
服务 器 过 程 发 出 通知 〈 回 想 15.11 节 ， 当 客户 过 早 终止 时 ， 门 服务 器 线 
程 被 取消 ) 。 

为 产生 这 个 条 件 ， 我 们 的 客户 程序 在 调用 服务 器 过 程 的 紧 前 调用 
alarm(3)， 我 们 的 服务 器 过 程 则 调用 sleep(6)。 (图 15-30 和 图 15-31 中 使 
用 [ 门 的 例子 就 是 这 么 做 的 。 由 于 客户 没有 捕获 SIGALRM， 其 进程 将 在 
服务 器 的 应 管 返 回 前 约 3 秒 时 由 内 核 终止 。) 我 们 在 BSD/OS 系 统 上 运 
行 客户 程序 ， 在 Solaris 系 统 上 运行 服务 器 程序 。 

bsdi % client solaris 44 tcp 


Alarm call 


在 客户 方 发 生 的 情况 是 我 们 预期 的 ， 但 在 服务 器 方 没 有 发 生 任何 
特殊 之 事 。 服 务 器 过 程 结束 其 6 秒 钟 的 睡眠 后 返回 。 用 tcpdump 查 看 所 
发 生 的 情况 ， 我 们 看 到 以 下 情况 。 

当 客户 终止 时 (在 启动 后 约 3 秒 时 ) ， 客 户主 机 的 TCP 向 服务 器 主 
机 的 TCP 发 送 一 个 FIN， 服 务 絮 主机 的 TCP 对 它 作 了 确认 。 按 照 TCP 的 
术语 ， 这 个 过 程 称 为 半 关 闭 (half_close，TCPvV1 的 18.5 节 ) ° 

客户 和 服务 器 启动 后 约 6 秒 时 ， 服 务 器 发 送 其 应 答 ， 该 应 答 由 服务 
器 主机 的 TCP 发 送 给 客户 。〈 正 如 UNPv1 第 130~132 页 中 讲述 的 那样 ， 
接收 到 一 个 FIN 后 通过 同一 TCP 连 接 发 送 数据 没有 问题 ， 因 为 TCP 连 接 

全 双 工 的 。) 客户 主机 的 TCP 响 应 以 一 个 RST 分 节 CE, 
prm MA 服务 器 下 一 次 在 这 个 连接 上 读 或 写 时 将 认识 到 这 
现状 ， 然 而 目前 什么 都 不 发 生 。 

我 们 汇总 一 下 本 节 探 讨 的 几 个 关键 点 

使 用 UDP 的 RPC 客 户 和 服务 器 永远 不 知道 对 方 是 否 过 早 终 止 。 当 
接收 不 到 响应 时 ， 它 们 可 能 超时 ， 不 过 无 法 分 辨 错误 类 型 : 进程 过 早 
终止 、 对 方 主 机 衣 溃 、 网 络 不 可 达 ， 等 等 。 

使 用 TCP 的 客户 和 服务 器 检测 出 对 方 所 存在 问题 的 机 会 要 大 得 多 
因为 对 方 进 程 的 过 早 终止 自动 导致 对 方 主机 的 TCP 关 闭 其 所 在 — 
接 。 但 是 如 果 对 方 是 一 个 线程 化 的 服务 器 ， 这 一 点 就 不 起 作用 ， 因 为 
对 方 线程 的 终止 并 不 会 关闭 其 所 在 端的 连接 。 另外 这 一 点 也 无 助 于 检 
测 对方 主 机 的 山 演 ， 因 为 发 生 这 种 情况 时 ， 对 方 主机 的 TCP 并 没 关 闭 它 
的 打开 着 的 连接 。 为 处 理 所 有 这 些 情形 ， 超 时 机 制 仍然 是 必需 的 。 


— 


16.8 XDR: 外 音 ZR 


使 用 前 一 章 中 讲述 的 门 从 一 个 进程 调用 男 一 个 进程 中 的 某 个 过 程 
时 ， 这 两 个 进程 处 于 同一 全 主机 上 ， 因 而 没有 数据 转换 问题 。 但 是 对 


于 不 同 主机 间 的 RPC， 各 种 各 样 的 主机 可 能 使 用 不 同 的 数据 格式 。 首 
和 完 ， 各 个 基本 的 C 数 据 类 型 可 能 有 不 同 的 大 小 〈 例 如 某 些 系统 上 long 数 
据 类 型 占据 32 位 ， 其 他 系统 上 却 占 据 64 位 ) 。 其 次 ， 各 个 位 真正 的 先 
后 顺序 可 能 不 一 样 (也 就 是 大 端 字 市 序 和 小 端 字 节 序 的 差异 ， 我 们 在 
UNPv1 第 66 一 69 页 和 第 137 一 140 页 [8] 中 讨论 过 ) 。 我 们 已 随 图 16-3 磁 
到 过 这 个 问题 ， 那 时 我 们 在 小 端 字 和 序 的 x86 系 统 上 运行 服务 器 程序 ， 
在 大 端 字 节 序 的 Sparc 系 统 上 运行 客户 程序 ， 人 然而 这 样 的 两 台 主 机 之 间 
仍 能 正确 地 交换 长 整数 。 

Sun RPC 使 用 XDR 即 外 部 数据 表示 (External Data Representation) 
标准 来 描述 和 编码 数据 (RFC 1832 [Srinivasan 1995b] ) 。XDR 既 是 
一 种 用 于 摘 述 数据 的 语言 ， 又 是 一 组 用 于 编码 数据 的 规则 。XDR 使 用 
隐 式 类 型 指定 (implicit typing) 方式 ， 它 意味 着 发 送 者 和 接收 者 都 得 
知道 数据 的 类 型 和 字 节 序 ， 例如 两 个 32 位 整数 值 后 跟 一 个 单 精 度 浮 点 
数值 ， 再 跟 一 个 字符 串 。 

作为 比较 ， 在 OSI 领域 中 ASN.1 (抽象 语法 表示 1，Abstract Syntax 
Notation one) 是 描述 数据 的 通常 方式 ，BER 〈 基 本 编码 规则 ，Basic 
Encoding Rules) 是 一 种 编码 数据 的 常用 方式 。 这 种 方案 还 使 用 显 式 类 
型 指定 (explicit typing) 方式 ， 它 意味 着 每 个 数据 值 之 前 冠 以 描述 所 跟 
数据 之 类 型 的 某 个 值 ( 称 为 “指定 符 (specifier) ") 。 对 应 刚才 这 个 例 
子 的 字 市 流 按 顺序 含有 以 下 各 个 字段 :说 下 一 个 值 是 一 个 整数 的 指定 
符 、 整 数值、 说 下 一 个 值 是 一 个 整数 的 指定 符 、 整 数值 、 说 下 一 个 值 
是 一 个 浮 点 数 的 指定 符 、 浮 点 数值 、 说 下 一 个 值 是 一 个 字符 串 的 指定 
KF. FITE o 

所 有 数据 类 型 的 XDR 表 示 都 需要 4 的 倍数 的 字 和 蔬 数 ， 这 些 字 节 总 是 
以 大 端 字 方 序 传送 的 。 融 符号 整数 值 使 用 二 进 制 补 码 (two's 
complement) 记 法 存放 ， 浮 点 数值 则 使 用 IEEE 格 式 存放 。 可 变 长 度 字 
段 总 是 在 其 末端 含有 最 多 3 个 字 节 的 填充 ， 这 样 下 一 个 条 目 总 是 落 在 某 


个 4 子 市 的 边界 。 例 如 一 个 5 字 市 的 ASCII 了 字符 串 将 作为 12 个 字 届 来 传 
1K: 

4 TAROT Ra, HENS; 

SFT AF T RAE 

3 个 字 市 的 值 为 0 的 填充 。 

在 讲述 XDR 和 它 支 持 的 数据 类 型 时 ， 我 们 考虑 以 下 三 个 问题 。 

(1) 如 何在 RPC 说 明 书 文件 .x 文件 ， 中 给 rpcgen 声 明 各 种 类 型 的 变 
量 ? 到 此 为 止 的 唯一 一 个 例子 (图 16-1) 只 使 用 一 个 长 整数 。 

(2)rpcgen 把 定义 在 .x 文件 中 的 变量 转换 成 日 己 产 生 的 .h 头 文件 中 的 
哪 一 种 C 数 据 类 型 ? 

(3) 所 传送 数据 的 真正 格式 是 什么 ? 

图 16-14 回 答 了 前 两 个 问题 。 为 产生 这 张 表格 ， 我 们 创建 了 一 个 
RPC 说 明 书 文件 ， 它 用 到 了 所 有 受 文 持 的 XDR 数 据 类 型 。 该 文件 通过 
rpcgen 运 行 后 ， 我 们 查看 所 产生 的 C 头 文件 从 而 构造 出 该 表格 。 


— RPC 说 明 书 文件 (ox) CEM Ch) 
[1 [const name = value; | define name value 
一 一 typedef t — typedef declaration; 


char var; char var; 

short var; short var; 

int var; int var; 

long var; long var; 

hyper var; longlong t var; 


unsigned char var; u char var; 
unsigned short var; u short var; 
unsigned int var; u int var; 
unsigned long var; u long var; 
unsigned hyper var; u longlong t var; 


5 float var; float var; 
double var; double var; 
—— var ; ae var ; 


一 


enum var 1 name - const, enum var ( name - const, « d 
typedef enum var var; 
| & | opaque var[n] ; char var [n] ; 


opaque var<m>; struct { 
u_int var_len; 
char *var_val; 
} var; 


| 10 | stringvarem; | char *vr; | 
datatype var [n] ; datatype var [n] ; 


datatype varem» ; struct { 
u_int var_len; 
Tm" *var val; 
var ; 


struct var ( members SE var ( members 
typedef - md var var; 


union var switch (int disc) ( struct var ( 
case discvalueA: armdeclA ; int disc; 
case discvalueB: armdeclB ; union { 
5 ane armdeclaA ; 
default: defaultdecl; armdeclB ; 


i defaultdecl ; 
var u; 


, 
typedef struct var var; 


图 16-14 XDR 和 rpcgen 支 持 的 数据 类 型 的 汇总 
我 们 现在 详细 描述 各 个 表 项 ， 并 以 第 一 栏 中 给 出 的 顺序 号 a~ 
15) 指称 它们 。 
(1)const 声 明 转 换 成 C 的 #define ° 


(2)typedef 声 明 转 换 成 C 的 typedef 。 

(3) 这 些 是 总 共 5 个 的 市 符号 整数 数据 类 型 。 其 中 前 4 个 是 由 XDR 作 
为 32 位 值 传 送 的 ， 最 后 一 个 是 由 XDR 作 为 64 位 值 传送 的 。 

对 于 许多 C 编 译 絮 来 说 ，64 位 整数 的 类 型 为 long long int 或 long 
long。 然 而 不 是 所 有 的 编译 器 和 操作 系统 都 支持 它们 。 既 然 所 生成 的 .h 
文件 声明 这 样 的 C 变 量 的 类 型 为 longlong t， 因 此 某 个 头 文件 中 必须 有 
如 下 的 定义 : 

typedef long long longlong t; 

XDR 的 long 类 型 占据 32 位 ， 但 是 64 位 Unix 系 统 上 的 C 语 言 long 类 型 
占据 64 位 (例如 UNPv1 第 27 页 [9] 描述 的 LP64 模 型 ) 。 这 些 10 年 前 的 
XDR 和 名 字 在 当今 的 世界 中 确实 是 不 答 的 。 更 好 的 名 字 可 能 是 int8 t^ 
int16 t^ int32 t ^ int64 t$5 ° 

(4) 这 些 是 总 共 5 个 的 无 符号 整数 数据 类 型 。 其 中 前 4 个 是 由 XDR 作 
为 32 位 值 传 送 的 ， 最 后 一 个 是 由 XDR 作 为 64 位 值 传送 的 。 

(5) 这 些 是 总 共 3 个 的 浮 点 数 数据 类 型 。 其 中 第 一 个 作为 32 位 值 传 
送 ， 第 二 个 作为 64 位 值 传送 ， 第 三 个 作为 128 位 值 传 送 。 

四 精度 浮 点 数 在 C 语 言 中 的 类 型 为 long double。 然 而 不 是 所 有 的 编 
译 器 和 操作 系统 都 支持 它们 。 (你 的 编译 器 也 许 允 许 long double, (HH 
是 把 它 作 为 double 类 型 处 理 。) 由 于 所 生成 的 .hn 文件 声明 这 样 的 C 变 量 
的 类 型 为 quadruple， 因 此 某 个 头 文件 中 必须 有 如 下 的 定义 : 

typedef long double quadruple; 

举例 来 说 ，Solaris 2.6 下 我 们 必须 在 ,x 文 件 的 开始 处 包含 如 下 的 


一 


ÎT: 

%#include <floatingpoint.h> 

因为 该 头 文 件 包 含 了 所 需 的 定义 。 该 行 开头 的 百 分 号 告诉 rpcgen 把 
本 行 剩余 部 分 原封 不 动 地 放 入 所 产生 的 .:h 头 文件 中 。 


(6) 布 尔 (boolean) 数据 类 型 与 一 个 带 符 号 整数 等 效 。RPC 头 文件 
同时 定义 常 值 TRUE 为 1， 常 值 FALSE 为 0 。 

(7) 一 个 枚 举 (enumeration) 数据 类 型 与 一 个 带 符号 整数 等 效 ， 且 
跟 C 语 言 的 enum 数 据 类 型 一 样 。rpcgen 还 给 所 指定 的 变量 名 产生 一 个 
typedef 定 义 。 

(8) 固 定 长 度 不 透明 数据 (fixed-length opaque data) 是 作为 8 位 值 传 
送 的 确定 数目 (n) 的 字 节 ， 运 行 时 函数 库 不 解释 它 。 

(9) 可 变 长 度 不 透明 数据 (variable-length opaque data) 也 是 作为 8 位 
值 传送 的 不 作 解 释 的 一 个 字 贡 序列， 不 过 真正 的 字 和 数 是 作为 一 个 无 
符号 整数 先 于 数据 传送 的 。 发 送 这 种 类 型 的 数据 时 〈 例 如 先 于 某 个 
RPC 调 用 填写 传递 给 它 的 参数 时 ) ， 应 在 发 出 调用 之 前 设置 长 度 。 接 
收 这 种 类 型 的 数据 时 ， 必 须 检 查 其 长 度 以 确定 后 跟 多 少数 据 。 

声明 中 的 最 大 长 度 m 可 被 忽略 。 但 是 如 果 编 译 时 指定 了 长 度 ， 那 么 
运行 时 函数 库 将 检查 真正 的 长 度 (我 们 作为 相应 C 结 构 的 var_len 成 员 给 
出 的 内 容 ) 没有 超过 m 的 值 。 

(10) 一 个 字符 串 (string) 是 一 个 ASCII 字 符 序 列 。 字 符 串 在 内 存 中 
是 作为 一 个 普通 的 以 空 字 符 结 尾 的 C 字 符 串 存放 的 ， 但 在 传输 中 却 冠 以 
一 个 指定 后 跟 字 符 实 际 数目 〈 不 包括 结尾 的 空 字符 ) 的 无 符号 整数 。 
发 送 这 种 类 型 的 数据 时 ， 运 行 时 系统 通过 调用 strlen 确 定 字 符 数 。 接 收 
这 种 类 型 的 数据 时 ， 它 是 作为 一 个 以 空 尝 符 结 尾 的 C 字 符 串 存放 的 。 

声明 中 的 最 大 长 度 m 可 被 忽略 。 但 是 如 果 编 译 时 指定 了 长 度 ， 那 么 
运行 时 函数 库 将 检查 真正 的 长 度 没 有 超过 m 的 值 。 

(11) 一 个 任意 数据 类 型 的 固定 长 度数 组 (fixed-length array) 是 作为 
该 数据 类 型 的 一 个 n 个 元 素 的 序列 传送 的 。 

(12) 一 个 任意 数据 类 型 的 可 变 长 度数 组 (variable-length array) 作 
为 指定 该 数组 中 实际 元 素数 目的 一 个 无 符号 整数 以 及 后 跟 的 各 个 数组 
元 素 传 送 。 


声明 中 的 最 大 长 度 m 可 被 忽略 。 但 是 如 果 编 译 时 指定 了 长 度 ， 那 么 
运行 时 函数 库 将 检查 真正 的 长 度 没 有 超过 m 的 值 。 

(13) 一 个 结构 (structure) 是 通过 轮流 传送 其 各 个 成 员 来 传送 的 。 
rpcgen 还 给 所 指定 的 变量 名 产生 一 个 typedef 定 义 。 

(14) 一 个 带 判 别 式 的 联合 (discriminated union) 由 一 个 整数 判别 式 
后 跟 基于 该 判别 式 的 值 的 一 组 数据 类 型 BRAS (arm) ) 构成 。 在 
图 16-14 中 给 出 的 判别 式 是 一 个 int， 但 它 也 可 以 是 一 个 unsigned int ^ — 
个 enum 或 一 个 bool (所 有 这 些 判 别 式 都 作为 一 个 32 位 整数 值 传送 ) 
传送 一 个 带 判 别 式 的 联合 时 ， 其 判别 式 的 32 位 值 首 先 传送 ， 然 后 传送 
对 应 于 该 判别 式 的 值 的 唯一 一 个 分 支 值 。 这 种 联合 的 default 声 明 往 往 是 
void， 它 的 意思 是 在 判别 式 的 32 位 值 之 后 不 跟 任何 数据 。 我 们 稍 后 给 出 
这 样 的 一 个 例子 。 

(15) 可 选 数据 (optional data) 是 一 种 特殊 类 型 的 联合 ， 我 们 将 随 图 
16-24 中 给 出 的 一 个 例子 描述 它 。 这 种 数据 类 型 的 XDR 声 明 看 着 像 是 一 
个 C 指 针 声 明 ， 它 就 是 所 生成 的 .bh 文件 所 包含 的 内 容 。 

图 16-15 汇 总 了 XDR 给 它 的 各 种 数据 类 型 采用 的 编码 格式 。 

16.8.1 例子 : 不 涉及 RPC 使 用 XDR 

现在 给 出 一 个 不 涉及 RPC 使 用 XDR 的 例子 。 也 就 是 说 ， 我 们 将 使 
用 XDR 把 一 个 二 进 制 数据 的 结构 编码 成 一 种 可 在 其 他 系统 上 加 以 处 理 
的 机 器 无 关 表示 。 这 种 技巧 可 用 于 以 一 种 与 机 器 无 关 的 格式 书写 文 
件 ， 或 者 以 一 种 与 机 器 无 关 的 格式 通过 网 络 向 另 一 台 计 算 机 发 送 数 
据 。 图 16-16 给 出 了 我 们 的 RPC 说 明 书 文件 data.x， 它 实际 上 只 是 一 个 
XDR 说 明 书 文件 ， 因 为 我 们 没有 声明 任何 RPC 过 程 。 

文件 名 后 级 .x 来 自 “XDR 说 明 书 文件 ”一 词 。RPC 规 范 (RFC 1831) 
中 说 ， 有 时 称 为 RPCL 的 RPC 语 言 与 XDR 语 言 (在 RFC 1832 中 定义 ) Æ 
本 相同 ， 差 别 只 是 后 者 增加 了 程序 定义 (用 于 描述 程序 、 版 本 和 过 
程 ) 。 


声明 枚 举 和 带 判 别 式 的 联合 

17-11 声明 一 个 共有 两 个 值 的 枚 举 数 据 类 型 ， 后 跟 一 个 把 该 枚 举 类 
型 作为 判别 式 的 带 判 别 式 联合 。 如 果 该 判别 式 的 值 为 RESULT_INT， 那 
么 在 该 判别 式 的 值 之 后 传送 的 是 一 个 整数 值 。 如 果 该 判别 式 的 值 为 
RESULT_DOUBLE， 那 么 在 该 判别 式 的 值 之 后 传送 的 是 一 个 双 精 度 浮 
点 数值 。 否 则 的 话 ， 在 该 判别 式 的 值 之 后 不 传送 任何 数据 。 

声明 结构 

127-21 声明 一 个 包含 多 个 XDR 数 据 类 型 的 结构 。 
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4 字 节 分支 的 大 小 是 4 字 节 的 倍数 
图 16-15 XDR 给 它 的 各 种 数据 类 型 采用 的 编码 格式 


1 enum result 七 { 
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2 RESULT INT - 1, RESULT DOUBLE - 2 


union union arg switch (result t result) ( 
case RESULT INT: 


int 


intval; 


case RESULT DOUBLE: 


default: 
void; 


iu 


4 
5 
6 
A 
8 double doubleval; 
9 
0 
T 


12 struct data { 


13 short 
14 long 


15 string 


16 opaque 
17 opaque 
18 short 
19 long 


short_arg; 
long_arg; 


vstring_arg<128>; 


fopaque_arg [3]; 
vopaque_arg<>; 
fshort arg[4]; 
vlong arg<>; 


20 union arg uarg; 


/* variable-length string */ 
/* fixed-length opaque */ 
/* variable-length opaque */ 
/* fixed-length array */ 
/* variable-length array */ 
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图 16-16 XDR 说 明 书 文件 


既然 data.x 没 有 声明 任何 RPC 过 程 ， 当 碍 看 图 16-4 中 由 mpcgen 产 生 的 
所 有 文件 时 ， 我 们 看 到 rpcgen 并 没有 产生 客户 程序 存根 和 服务 器 程序 存 
根 。 不 过 它 仍 然 产 生 了 data.h 头 文件 和 data_xdr.c 文 件 ， 其 中 data_xdr.c 含 
有 用 于 编码 或 解码 在 我 们 的 data.x 文 件 中 所 声明 数据 条 目的 XDR 函 数 。 

图 16-17 给 出 了 所 产生 的 data.h 头 文件 。 按 照 图 16-14 中 给 出 的 转换 
规则 ， 该 头 文件 的 内 容 正 是 我 们 所 预期 的 。 


/* 


* Please do not edit this file. It was generated using rpcgen. 


*/ 


#ifndef DATA H RPCGEN 
#define DATA H RPCGEN 


enum result t { 
RESULT INT - 1, 
RESULT DOUBLE - 2 
h 
typedef enum result t result t; 


struct union arg { 
result t result; 
union ( 
int intval; 
double doubleval; 
) union arg u; 
}; 


typedef struct union arg union arg; 


struct data { 


图 16-17 由 rpcgen 从 图 16-16 产 生 的 头 文件 
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20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 


36 
27 
38 
39 


40 


short short arg; 
long long arg; 
char *vstring arg; 
char fopaque arg[3]; 
struct { 
u int vopaque arg len; 
char *vopaque arg val; 
} vopaque arg; 
short fshort arg[4]; 
struct { 
u int  vlong arg len; 
long *vlong arg val; 
} viong arg; 
union arg uarg; 
E 


typedef struct data data; 


/* the xdr functions */ 


extern bool t xdr result t(XDR *, result t*); 
extern bool t xdr union arg(XDR *, union arg*); 


extern bool t xdr data(XDR *, data*); 


#endif /* ! DATA H RPCGEN */ 


图 16-17 ( 续 ) 
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在 data_xdrc 文 件 中 定义 了 一 个 名 为 xdr_data 的 函数 ， 我 们 可 调用 它 
来 编码 或 解码 已 定义 的 data 结 构 的 内 容 。 (函数 名 后 级 _data 来 自 图 16- 
16 中 所 定义 结构 的 名 字 。) 我 们 编写 的 第 一 个 程序 的 文件 名 为 write.c， 
它 设置 data 结 构 中 所 有 变量 的 值 ， 调 用 xdr_data 函 数 把 所 有 字段 编码 成 
XDR 格 式 ， 然 后 把 结果 写 往 标准 输出 。 

图 16-18 给 出 了 这 个 程序 。 

把 结构 成 员 设 置 成 某 个 非 零 值 

12~32 首先 把 data 结 构 的 所 有 成 员 设 置 成 某 个 非 零 值 。 对 于 可 变 
长 度 成 员 ， 我 们 必须 设置 一 个 计数 以 及 这 个 数目 的 值 。 对 于 带 判 别 式 
的 联合 ， 我 们 将 判别 式 的 值 设置 为 RESULT_INT， 对 应 的 结果 整数 值 为 
123 ° 

分 配 适 当地 对 齐 的 缓冲 区 

33 调用 malloc 分 配 XDR 例 程 将 往 其 中 存 入 数据 的 缓冲 区 空间 。 由 
于 该 缓冲 区 必须 在 某 个 

4 字 节 的 边界 上 对 齐 ， 因 此 简单 地 静态 分 配 一 个 char 数 组 不 能 保证 
这 种 对 齐 要 求 。 

创建 XDR 内 存 流 

34 运行 时 库 函 数 xdrmem_create 把 由 buff 指 加 的 绥 神 区 初 Tor 
XDR 用 作 一 个 内 存 流 。 我 们 分 配 一 个 名 为 xhandle 的 XDR 类 型 的 变 
A E ds ee 合 该 函数 。 xui cq eim 

这 个 变量 中 维护 相关 信息 〈 缓 冲 区 指针 、 缓 冲 区 中 的 当前 位 置 等 ) e 

最 后 一 个 参数 是 XDR_ENCODE， 它 告诉 XDR 我 们 需 从 主机 格式 (我 们 
的 out 结 构 ) 转换 成 XDR 格 式 。 

编码 结构 

35~36 调用 由 rpcgen 在 data_xdrc 文 件 中 生成 的 xdr_data 函 数 ， 它 把 
out 结 构 编 码 成 XDR 格 式 。 返 回 值 为 TRUE 表示 成 功 。 


sunrpc/xdr l/write.c 


1 #include "unpipc.h" 
2 #include "data.h" 
3 int 
4 main(int argc, char **argv) 
5 { 
6 XDR xhandle; 
7 data out; /* the structure whose values we store */ 
8 char *buff; /* the result of the XDR encoding */ 
9 char vop [2] ; 
10 long vlong [3] ; 
11 u_int size; 
12 out.short arg = 1; 
13 out.long arg - 2; 
14 out.vstring arg = "hello, world"; /* pointer assignment */ 
15 out.fopaque arg[0] = 99; /* fixed-length opaque */ 
16 out.fopaque arg[1] - 88; 
17 out.fopaque arg[2] - 77; 
18 vop[0] = 33; /* variable-length opaque */ 
19 vop[1] = 44; 
20 out.vopaque arg.vopaque arg len - 2; 
21 out.vopaque arg.vopaque arg val - vop; 
22 out.fshort arg[0] - 9999; /* fixed-length array */ 
23 out.fshort arg[1] - 8888; 
24 out.fshort arg[2] - 7777; 
25 out.fshort arg[3] - 6666; 
26 vlong[0] = 123456; /* variable-length array */ 
27 vlong[1] = 234567; 
28 vlong[2] = 345678; 
29 out.vlong arg.vlong arg len - 3; 
30 out.vlong arg.vlong arg val - vlong; 
31 out.uarg.result - RESULT INT; /* discriminated union */ 
32 out.uarg.union arg u.intval - 123; 
33 buff = Malloc(BUFFSIZE) ; /* must be aligned on 4-byte boundary */ 
34 xdrmem create(&xhandle, buff, BUFFSIZE, XDR ENCODE); 
35 if (xdr data(&xhandle, &out) !- TRUE) 
36 err quit("xdr data error"); 
37 size = xdr getpos (&xhandle); 
38 Write(STDOUT FILENO, buff, size); 
39 exit (0); 
40 ) 


图 16-18 初始 化 data 结 构 并 以 XDR 格 式 将 它 写 出 


获取 编码 后 数据 的 大 小 并 write 
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37--38 函数 xdr_getpos 返 回 XDR 运 行 时 系统 在 输出 缓冲 区 中 的 当前 
位 置 (也 就 是 待 存 入 的 下 一 个 字 节 的 字 厄 偏 移  ， 我 们 用 它 作 为 write 
调用 的 长 度 参数 。 

图 16-19 给 出 了 我 们 的 read 程 序 ， 它 读 入 由 前 一 个 程序 写 出 的 文 
件 ， 输 出 data 结 构 所 有 成 员 的 值 。 


sunrpc/xdr l/read.c 


1 #include "unpipc.h" 

2 #include "data.h" 

3 qu 

4 main(int argc, char **argv) 

5 { 

6 XDR xhandle; 

7 int l1; 

8 char *buff; 

9 data in; 

10 ssize t n; 

11 buff = Malloc(BUFFSIZE) ; /* must be aligned on 4-byte boundary */ 
12 n = Read(STDIN FILENO, buff, BUFFSIZE); 

13 printf("read $1d bytes\n", (long) n); 

14 xdrmem create(&xhandle, buff, n, XDR DECODE); 

15 memset(&in, 0, sizeof(in)); 

16 if (xdr data(&xhandle, &in) !- TRUE) 

17 err quit("xdr data error"); 

18 printf("short arg = $d, long arg = %ld, vstring arg = '%s'\n", 
19 in.short arg, in.long arg, in.vstring arg); 

20 printf("fopaque[] = %d, $d, %d\n", 

21 in.fopaque arg[0], in.fopaque arg[1], in.fopaque arg[21); 
22 printf("vopaque«» ="); 

23 for (i = 0; i < in.vopaque arg.vopaque arg len; i++) 

24 printf(" $d", in.vopaque arg.vopaque arg vallil); 

25 printf ("Mn"); 

26 printf("fshort arg[] = %d, %d, $d; %d\n", in.fshort arg[0], 
27 in.fshort arg[1], in.fshort arg[2], in.fshort arg[31); 
28 printf ("vlong<> ="); 

29 for (i = 0; i < in.vlong_arg.vlong_arg len; i++) 

30 printf (" $1d", in.vlong arg.vlong arg val [i]); 

31 printf ("Nn"); 

32 switch (in.uarg.result) { 

33 case RESULT INT: 

34 printf("uarg (int) = $dWMn", in.uarg.union arg u.intval); 
35 break; 

36 case RESULT DOUBLE: 

37 printf("uarg (double) = %g\n", in.uarg.union arg u.doubleval); 
38 break; 

39 default: 

40 printf ("uarg (void) \n"); 

41 break; 

42 } 

43 xdr_free(xdr_data, (char *) &in); 

44 exit (0); 

45 } 


图 16-19 读 入 XDR 格 式 的 data 结 构 并 输出 其 值 


sunrpc/xdr l/read.c 


分 配 适 当 对 齐 过 的 缓冲 区 

11713 调用 malloc 分 配 一 个 适当 对 齐 过 的 缓冲 区 ， 把 由 前 一 个 程 
序 生成 的 文件 读 入 该 缓冲 区 。 

创建 XDR 内 存 流 ， 初 始 化 缓冲 区 ， 然 后 解码 

147-17 初始 化 一 个 XDR 内 存 流 ， 这 次 指定 XDR_DECODE 以 指示 
我 们 和 希望 从 XDR 格 式 转换 成 主机 格式 。 把 我 们 的 in 结构 初始 化 为 0 后 调 
用 xdr_data， 从 而 把 缓冲 区 buff 中 的 数据 解码 到 in 结构 中 。 我 们 必须 把 
XDR 目的 地 (int) 初始 化 为 0， 因 为 有 些 XDR 例 程 (例如 
xdr string) 需要 这 样 做 。xdr_data 与 我 们 从 图 16-18 中 调用 的 同名 函数 
是 一 样 的 ， 有 变化 的 是 xdrmem_create 的 最 后 一 个 参数 : 前 一 个 程序 中 
指定 的 是 XDR_ENCODE， 本 程序 中 指定 的 是 XDR_DECODE。 该 值 由 
xdrmem_create 保 存在 XDR 人 句柄 (xhandle) 中 ，XDR 运 行 时 系统 就 用 它 
来 确定 是 编码 数据 还 是 解码 数据 。 

输出 结构 的 值 

18--42 输出 我 们 的 data 结 构 的 所 有 成 员 的 值 。 

释放 由 XDR 分 配 的 任何 内 存 空 间 

43 调用 xdr_free 释 放 XDR 运 行 时 系统 可 能 已 动态 分 配 的 内 存 空间 

(参见 习题 16.10) 。 

我 们 在 一 台 Sparc 主 机 上 运行 write 程序 ， 并 把 标准 输出 重新 定 同 到 

一 个 名 为 data 的 文件 : 


solaris % write > data 


solaris 96 Is -l data 

-rw-rw-r-- 1 rstevens other1 76 Apr 23 12:32 data 

我 们 看 到 文件 大 小 为 76 字 方 ， 这 跟 图 16-20 是 对 应 的 ， 该 图 详细 展 
示 了 数据 的 存放 情况 (19 个 4 字 节 值 )。 


short 
long 


string «128» 


opaque [3] 


opaque «» 


short [4] 


图 16-20 由 图 16-18 写 出 的 XDR 流 的 格式 

在 BSD/OS 或 Digital Unix 下 读 这 个 二 进 制 文件 ， 结 果 跟 我 们 预料 的 
一 致 : 

bsdi 96 read < data 

read 76 bytes 


short. arg = 1,long. arg = 2,vstring_arg = 'hello,world' 


fopaque[] = 99,88,77 

vopaque<> = 33 44 

fshort_arg[] = 9999,8888,7777,6666 

vlong<> = 123456 234567 345678 

uarg (int)= 123 

alpha % read < data 

read 76 bytes 

short. arg = 1,long_arg = 2,vstring arg = ‘hello,world' 

fopaque[] = 99,88,77 

vopaque<> = 33 44 

fshort_arg[] = 9999,8888,7777,6666 

vlong<> = 123456 234567 345678 

uarg (int)= 123 

16.8.2 例子 : 计算 缓冲 区 的 大 小 

在 前 一 个 例子 中 我 们 分 配 了 一 个 长 度 为 BUFFSIZE (该 常 值 在 图 C- 
1 给 出 的 unpipch 头 文件 中 定义 为 8192) 的 缓冲 区 ， 它 的 大 小 足够 了 。 
不 笠 的 是 ， 没 有 一 种 简单 方法 来 计算 XDR 为 一 个 给 定 的 结构 编码 所 需 
的 总 大 小 。 只 计算 该 结构 的 sizeof 值 是 不 对 的 ， 因 为 该 结构 的 每 个 成 员 
由 XDR 分 别 编码 。 我 们 必须 逐个 成 员 地 再 历 这 个 结构 ， 把 XDR 将 用 于 
编码 各 个 成 员 的 大 小 加 在 一 起 。 举 例 来 说 ， 图 16-21 给 出 了 一 个 有 3 个 成 
员 的 结构 。 


sunrpc/xdr l/example.x 


1 const MAXC = 4; 


2 struct example { 


3 short a; 

4 double b; 

5 short c [MAXC] ; 
6 } i 


sunrpc/xdr l/example.x 


图 16-21 一 个 简单 结构 的 XDR 说 明 书 文件 


图 16-22 给 出 的 程序 计算 出 XDR 编 码 这 个 结构 所 需 的 字 节 数 为 28。 
8~9 宏 RNDUP 定 义 在 <rpc/xdr.h> 头 文件 中 ， 它 把 它 的 参数 同上 舍 入 到 
下 一 个 BYTES_PER_XDR_UNIT (4) 的 倍数 。 对 于 一 个 固定 长 度 的 数 
组 ， 使 用 该 宏 计算 出 每 个 元 素 的 大 小 后 乘 以 元 素数 即 可 。 


sunrpc/xdr I/example.c 


1 #include "unpipc.h" 
2 #include "example.h" 
3. int 


4 main(int argc, char **argv) 


6 int size; 

7 example foo; 

8 size = RNDUP(sizeof(foo.a)) + RNDUP(sizeof(foo.b)) + 
9 RNDUP (sizeof (foo.c[0])) * MAXC; 

10 printf ("size = %d\n", size); 

11 exit (0); 


sunrpc/xdr I/example.c 


图 16-22 计算 XDR 编 码 所 需 字 节 数 的 程序 

这 种 技巧 的 问题 出 在 可 变 长 度数 据 类 型 上 。 如 果 我 们 声明 string 
d<10>， 那 么 所 需 的 最 大 字 节 数 为 RNDUP(sizeof(int)) (用 于 存放 长 度 ) 
加 上 RNDUP(sizeof(char)*10) (用 于 存放 字符 ) 。 但 是 我 们 无 法 计算 不 
带 最 大 值 的 可 变 长 度数 据 类 型 的 大 小 ， 例 如 float e<>。 最 简单 的 办 法 是 
分 配 一 个 应 该 足够 大 的 缓冲 区 ， 并 检查 XDR 例 程 的 失败 情况 (参见 习 
题 16.5) ° 

16.8.3 例子 :可 选 数据 

XDR 说 明 书 文件 中 有 三 种 指定 可 选 数据 的 方式 ， 图 16-23 给 出 了 所 
有 这 三 种 方式 。 


sunrpc/xdr l/opt1.x 


union optlong switch (bool flag) { 
case TRUE: 
long val; 
case FALSE: 
void; 
js 


struct args ( 

optlong argl; /* union with boolean discriminant */ 
9 long arg2<1>; /* variable-length array with one element */ 
10 long *arg3; /* pointer */ 


oo N Nu PWD H|D 


sunrpc/xdr l/optl.x 


图 16-23 展示 三 种 指定 可 选 数据 的 方式 的 XDR 说 明 书 文件 

声明 一 个 带 布尔 型 判别 式 的 联合 

17-8 定义 一 个 带 TRUE 和 FALSE 两 个 分 支 的 联合 ， 并 把 某 个 结构 成 
员 定 义 为 该 类 型 。 当 判别 式 flag 为 TRUE 时 ， 后 跟 的 是 一 个 long 类 型 的 
值 ， 和 否则 什么 都 不 跟 。XDR 运 行 时 系统 编码 该 参数 时 ， 它 将 被 编码 成 
以 下 两 种 格式 之 一 : 

? 值 为 1 (TRUE) 的 4 字 节 标志 后 跟 一 个 4 字 贡 的 值 ; 

? 值 为 0 (FALSE) 的 4 字 节 标志 。 

声明 可 变 长 度数 组 

9 指定 一 个 最 多 一 个 元 素 的 可 变 长 度数 组 时 ， 它 将 被 编码 成 以 下 两 
种 格式 之 一 : 

值 为 1 的 4 字 节 长 度 后 跟 一 个 4 字 节 的 值 ; 

值 为 0 的 4 字 节 长 度 。 

声明 XDR 指 针 

10 成 员 arg3 展 示 了 指定 可 选 数据 的 一 种 新 方式 ( 它 对 应 于 图 16-14 
中 的 最 后 一 行 ) 。 该 参数 将 被 编码 成 以 下 两 种 格式 之 一 : 

值 为 1 的 4 字 节 标志 后 跟 一 个 4 字 万 值 ; 

? 值 为 0 的 4 字 节 标志 。 

这 具体 取决 于 编码 数据 时 相应 的 C 指 针 的 值 。 如 果 该 指针 非 空 ， 那 
就 使 用 第 一 种 编码 格式 (BFT) ， 否 则 使 用 第 二 种 编码 格式 (4 个 


字 节 的 0) 。 当 一 个 可 选 数据 在 代码 中 是 通过 指针 来 访问 时 ， 这 是 编码 
该 数据 的 较为 便利 的 方式 。 

使 得 前 两 个 声明 产生 同样 的 编码 格式 的 一 个 实现 上 的 细节 是 TRUE 
的 值 为 1， 它 恰好 是 只 有 一 个 元 素 的 可 变 长 度数 组 的 长 度 。 

图 16-24 给 出 了 由 rpcgen 为 这 个 说 明 书 文件 产生 的 .h 文 件 。 

14~21 尽管 所 有 三 个 参数 都 将 由 XDR 运 行 时 系统 编码 成 同样 的 格 
式 ， 在 C 代 码 中 设置 和 取出 它们 的 值 的 方法 却 各 不 相同 。 

图 16-25 是 一 个 简单 的 程序 ， 它 设置 上 述 所 有 三 个 参数 的 值 ， 使 得 
其 编码 中 没有 一 个 long 类 型 的 值 出 现 。 


sunrpc/xdr l/opt1.h 


7 struct optlong { 


8 int flag; 

9 union ( 

10 long val; 
11 } optlong u; 

12; } 5 


13 typedef struct optlong optlong; 


14 struct args { 


15 optlong argl; 

16 struct ( 

17 u int  arg2 len; 
18 long *arg2 val; 
19 ) arg2; 

20 long *arg3; 

21. )7 


22 typedef struct args args; 
sunrpc/xdr l/optl.h 


图 16-24 由 rpcgen 给 图 16-23 产 生 的 C 头 文件 


sunrpc/xdr 1/optIz.c 


1 #include "unpipc.h" 

2 #include "Optl.h" 

3 int 

4 main(int argc, char **argv) 

5 { 

6 int i; 

7 XDR xhandle; 

8 char *buff; 

9 long *lptr; 

10 args out; 

11 size t size; 

12 out.argl.flag - FALSE; 

13 out.arg2.arg2 len - 0; 

14 out.arg3 - NULL; 

15 buff = Malloc(BUFFSIZE) ; /* must be aligned on 4-byte boundary */ 
16 xdrmem create(&xhandle, buff, BUFFSIZE, XDR_ENCODE) ; 
17 if (xdr args(&xhandle, &out) !- TRUE) 

18 err quit("xdr args error"); 

19 Size = xdr getpos (&xhandle) ; 
20 lptr - (long *) buff; 
21 for (i = 0; i < size; i += 4) 
22 printf ("%ld\n", (long) ntohl(*lptr++)); 
23 exit (0); 
24 } 


sunrpc/xdr 1/optlz.c 


图 16-25 使 三 个 参数 都 不 编码 long 类 型 值 的 程序 


设置 各 个 值 

127-14 把 对 应 第 一 个 参数 的 联合 中 的 判别 式 设置 为 FALSE， 把 对 
应 第 二 个 参数 的 可 变 长 度数 组 的 长 度 设置 为 0， 把 对 应 第 三 个 参数 的 指 
针 设 置 为 NULL 。 

分 配 适 当 对 齐 过 的 缓冲 区 并 编码 

157-19 分 配 一 个 缓冲 区 ， 把 我 们 的 out 结 构 编 码 到 一 个 XDR 内 存 流 
中 o 

输出 XDR 缓 冲 区 

20~22 使 用 ntohl 函 数 (网 络 到 主机 长 整数 转换 画 数 ) 把 对 应 于 该 
内 存 流 的 缓冲 区 中 的 数据 从 XDR 使 用 的 大 端 字 市 序 转换 成 当前 主机 的 
字 节 序 ， 然 后 每 个 4 字 节 值 一 次 地 输出 。 


该 输出 准确 地 展示 了 由 XDR 运 行 时 系统 编码 到 该 缓冲 区 中 的 数 
据 。 

solaris % opt1z 

0 

0 

0 

正如 我 们 预期 的 那样 ， 每 个 参数 作为 值 全 为 0 的 4 个 字 市 编码 ， 指 
示 后 面 不 跟 任何 值 。 

图 16-26 是 对 前 一 个 程序 的 修改 ， 它 给 所 有 三 个 参数 赋值 ， 把 它们 
编码 到 一 个 XDR 内 存 流 中 ， 然 后 输出 这 个 流 。 


sunrpc/xdr1/optl.c 


1 #include "unpipc.h" 

2 #include “opti sh"! 

3 int 

4 main(int argc, char **argv) 

5 

6 int i; 

7 XDR xhandle; 

8 char *buff; 

9 long lval2, lval3, *lptr; 

10 args out; 

11 Size t size; 

12 out.argl.flag - TRUE; 

13 out.argl.optlong u.val = 5; 

14 lval2 = 9876; 

15 out.arg2.arg2 len - 1; 

16 out.arg2.arg2 val - &lval2; 

17 lwal3 s 1233 

18 out.arg3 - &lval3; 

19 buff = Malloc(BUFFSIZE) ; /* must be aligned on 4-byte boundary */ 
20 xdrmem create(&xhandle, buff, BUFFSIZE, XDR ENCODE); 
21 if (xdr args(&xhandle, &out) !- TRUE) 
22 err quit("xdr args error"); 
23 size = xdr getpos (&xhandle) ; 
24 lptr = (long *) buff; 
25 for (i = 0; i < size; i += 4) 
26 printf ("%ld\n", (long) ntohl (*lptr++) ) ; 
27 exit (0); 
28 } 


sunrpc/xdr l/optl.c 


图 16-26 给 来 自 图 16-23 的 所 有 三 个 参数 赋值 


设置 各 个 值 

12~18 为 给 对 应 第 一 个 参数 的 联合 赋 一 个 值 ， 我 们 把 它 的 判别 式 
设置 成 TRUE， 然 后 设置 它 的 值 。 为 给 对 应 第 二 个 参数 的 可 变 长 度数 据 
赋 一 个 值 ， 我 们 把 它 的 长 度 设置 为 1， 并 把 与 它 关 联 的 指针 设置 成 指向 
它 的 值 。 为 给 对 应 第 三 个 参数 的 指针 赋 一 个 值 ， 我 们 把 它 设 置 成 存放 
其 值 的 变量 的 地 址 。 

运行 这 个 程序 ， 输 出 的 是 预期 的 6 个 4 子 市 值 : 


solaris 96 opt1 


1 判别 式 值 为 TRUE 

1 可 变 长 度数 组 的 长 度 
1 非 空 指 针 变 量 的 标志 
5 

9876 

123 


16.8.4 例子 : 链表 处 理 

有 了 前 面 的 例子 所 介绍 的 编码 可 选 数 据 的 能 力 后 ， 我 们 就 可 以 对 
XDR 的 指针 表示 进行 扩充 ， 用 它 来 编码 和 解码 含有 可 变数 目 元 素 的 链 
表 。 我 们 的 例子 是 一 个 名 - 值 对 (name-value pair) 链表 ， 图 16-27 给 出 
了 它 的 XDR 说 明 书 文件 。 


sunrpc/xdr 1/opt2.x 


1 struct mylist { 

2 string name<>; 
3 long value; 
4 mylist *next; 


5 IE 
6 struct args { 
7 mylist *list; 


8 }; 


sunrpc/xdr l/opt2.x 


图 16-27 名 - 值 对 链表 的 XDR 说 明 书 文件 


17-5 我 们 的 mylist 结 构 含 有 一 个 名 - 值 对 和 一 个 指 癌 下 一 个 结构 的 
指针 。 该 链表 中 的 最 后 一 个 结构 将 有 一 个 值 为 null 的 next 指 针 。 
图 16-28 给 出 了 由 rpcgen 根 据 图 16-27 产 生 的 .h 文 件 。 


sunrpc/xdr l/opt2.h 


7 struct mylist { 

8 char *name; 

9 long value; 

10 struct mylist *next; 

11 

12 typedef struct mylist mylist; 


13 struct args { 

14 mylist *list; 

15 }; 

16 typedef struct args args; 

sunrpc/xdr l/opt2.h 


图 16-28 对 应 于 图 16-27 的 C 声 明 
图 16-29 给 出 的 程序 先 初始 化 一 个 含有 3 个 名 - 值 对 的 链表 ， 然 后 调 


用 XDR 运 行 时 系统 对 它 进行 编码 。 

初始 化 链表 

11~ 22 分 配 4 个 链表 项 的 空间 ， 但 只 初始 化 其 中 3 个 。 第 一 项 为 
nameval[2], ， 第 二 项 为 nameval[1]， 第 三 项 为 nameval[0]。 链表 的 头 

(out.list) 设置 成 &nameval[2]。 

以 这 样 的 顺序 初始 化 该 链表 是 为 了 展示 XDR 运 行 时 系统 依循 指针 
规则 ， 而 且 所 编码 的 链表 项 顺序 跟 所 用 的 数组 元 素 没有 关系 。 我 们 还 
把 各 个 链表 项 的 值 初始 化 成 十 六 进 制 什 ， 因 为 长 整数 值 是 以 十 六 进 制 
输出 的 ， 这 使 得 查看 每 个 字 节 中 的 各 个 ASCII 值 更 为 容易 。 


sunrpc/xdr 1/opt2.c 


1 #include "unpipc.h" 

2 #include "Opt2.h" 

3 int 

4 main(int argc, char **argv) 

5 { 

6 int i; 

7 XDR xhandle; 

8 long *lptr; 

9 args out; /* the structure that we fill */ 
10 char *buff; /* the XDR encoded result */ 
11 mylist  nameval[4]; /* up to 4 list entries */ 
12 size t size; 

13 out.list = &nameval [2]; /* [2] -> [1] -> [0] */ 
14 nameval [2] .name = "namel"; 

15 nameval [2] .value = 0x1111; 

16 nameval [2] .next = &nameval [1]; 

17 nameval [1] .name = "namee2"; 

18 nameval [1] .value = 0x2222; 

19 nameval [1] .next = &nameval [0]; 

20 nameval [0] .name = "nameee3"; 

21 nameval[0].value - 0x3333; 

22 nameval [0] .next = NULL; 

23 buff = Malloc(BUFFSIZE) ; /* must be aligned on 4-byte boundary */ 
24 xdrmem create(&xhandle, buff, BUFFSIZE, XDR ENCODE); 
25 if (xdr args(&xhandle, &out) !- TRUE) 

26 err quit("xdr args error"); 

27. size = xdr_getpos (&xhandle) ; 

28 lptr = (long *) buff; 

29 for (i = 0; i < size; i += 4) 

30 printf ("%81x\n", (long) ntohl (*lptr++)); 

31 exit (0); 

32 } 


图 16-29 9845 — SEXE, WSS B dA 


sunrpc/xdrl/opt2.c 


程序 的 输出 表明 ， 前 三 个 链表 项 之 前 有 一 个 为 1 的 4 字 节 值 (我 们 
既 可 以 认为 它 是 一 个 可 变 长 度数 组 值 为 1 的 长 度 ， 也 可 以 认为 它 是 布尔 
Í&TRUE) ， 第 四 个 表 项 仅 由 一 个 为 0 的 4 字 节 值 构成 ， 指 示 链 表 的 结 


尾 。 


solaris 96 opt2 


1 
5 


6e616d65 


后 跟 一 个 元 素 
字符 串 长 度 


name 


31000000 
1111 
1 
6 
6e616d65 
65320000 
2227 
1 
7 
6e616d65 
65653300 
3333 
0 


1, MEE 
相应 的 值 
后 跟 一 个 元 素 
字符 串 长 度 

name 

e2, 2/7 HRTESE TI 
相应 的 值 
IER — ICR 
字符 串 长 度 

name 

ee3, ITJEJE- T 
相应 的 值 

后 面 不 跟 元 素 : 链表 尾 


当 XDR 给 这 种 格式 的 链表 解码 时 ， 它 将 给 链表 项 和 指针 动态 分 配 


内 存 空间 ， 并 把 各 个 指针 链接 起 来 ， 以 允许 我 们 在 C 中 方便 地 遍历 整个 
BET ° 


16.9 RPC 分 组 格式 


图 16-30 展 示 了 封装 在 一 个 TCP 分 市 中 的 一 个 RPC 请 求 的 格式 。 


H 
标志 十 长 度 
事务 ID ( XID ) 


消息 类 型 ( 0= 调 用 ) 


unsigned int xid 


enum msg type 


unsegned int rpcvers 


unsigned int prog 


unsigned int vers 


号 


unsegned int proc 


enum auth flavor 


e + f+ A A A A A ORA 


rpc msg() 


cred 
call body() opaque body<400> 
enum auth flavor 认证 形式 4 
验证 器 长 度 4 
verf 
opaque body<400> 
验证 器 数据 最 多 400 字 节 


图 16-30 封装 在 一 个 ITCP 分 节 中 的 RPC 请 求 

既然 TCP 是 一 个 字 节 流 ， 不 提供 消息 边界 ， 因 此 应 用 程序 必须 提供 
界定 各 个 消息 的 某 种 方法 。Sun RPC 定 义 了 既 可 作为 请 求 也 可 作为 应 答 
的 记录 (record) ， 每 个 记录 由 一 个 或 多 个 片段 (fragment) 构成 。 
个 片段 以 一 个 4 字 节 值 开头 ， 其 中 最 高 位 是 最 终 片段 的 标志 ， 低 序 31 位 


是 计数 。 如 果 最 终 片段 标志 位 为 0， 那 么 构成 当前 记录 的 还 有 别 的 片 
E o 

这 个 4 字 节 值 跟 所 有 的 4 字 节 XDR 整 数 一 样 ， 是 以 大 端 字 节 序 传送 
的 ， 但 是 本 字段 却 不 在 标准 的 XDR 格 式 中 ， 因 为 XDR 并 不 传送 位 字 
段 o 

如 有 果 所 用 的 是 UDP 而 不 是 TCP， 那 么 紧 跟 在 UDP 首部 之 后 的 第 一 个 
字段 是 XID， 如 图 16-32 所 示 。 

使 用 TCP 时 ，RPC 请 求 和 应 答 的 大 小 几乎 不 存在 限制 ， 因 为 可 使 用 
任意 数目 的 厂 段 ， 而 每 个 片段 义 有 一 个 31 位 的 长 度 字 段 。 然 而 使 用 
UDP 时 ， 请 求 和 应 答 都 必须 适合 单个 UDP 数据 报 ， 而 一 个 数据 报 能 容 
纳 的 最 大 数据 量 是 65507 字 节 (假设 网 络 协议 为 IPv4) 。 先 于 TI-RPC 软 
件 包 的 许多 实现 还 把 请 求 或 应 答 的 大 小 进一步 限制 到 8192 字 市 左右 ， 
因此 如 果 请 求 或 应 答 需 要 多 于 约 8000 字 节 的 话 ， 那 就 得 改 用 TCP。 

我 们 现在 给 出 取 目 RFC 1831 的 一 个 RPC 请 求 的 真正 XDR 说 明 书 。 
图 16-30 中 给 出 的 名 字 就 出 自 该 说 明 书 。 

enum auth flavor { 

AUTH NONE = 0; 
AUTH SYS-1; 
AUTH SHORT -2 


/* and more to be defined */ 


h 
struct opaque auth 1 
auth flavor flavor; 
opaque body<400>; 
p 
enum msg type { 
CALL - 0; 


RELAY = 1 
Js 
struct call. body 1 


unsigned intrpcvers; /* RPC version: must be 2 */ 
unsigned intprog; /* program number */ 
unsigned intvers; /* version number */ 
unsigned intproc; /* procedure number */ 
opaque auth cred; /* caller's credentials */ 
opaque auth verf; /* caller's verifier */ 


/* procedure-specific parameters start here */ 
}; 
struct rpc_msg { 
unsigned int xid; 
union switch (msg_type mtype){ 
case CALL: 
call_body cbody; 
case REPLY: 
reply_body rbody; 
} body; 
}; 
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式 。 对 于 空 认 证 (默认 形式 ) 来 说 ， 该 不 透明 数据 的 长 度 应 为 0。 对 于 
Unix 认 证 来 说 ， 该 不 透明 数据 含有 如 下 信息 : 
struct authsys parms { 
unsigned int stamp; 
string machinename<255>; 


unsigned int uid; 


unsigned int gid; 
unsigned int gids<16>; 
H 
当 和 凭证 的 认证 形式 为 AUTH SYS 时 ， 验 证 器 的 认证 形式 应 为 
AUTH, NONE ° 
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图 16-31 展 示 了 RPC 应 答 的 各 种 可 能 。 


RE 


MSG ACCEPTED MSG DENIED 
SUCCESS PROG UNAVAIL RPC MISMATCH AUTH ERROR 


PROG MISMATCH 
PROC UNAVAIL 

GARBAGE ARGS 

SYSTEM ERR 


图 16-31 可 能 的 RPC 应 答 


图 16-32 展 示 了 一 个 成 功 的 RPC 应 管 的 格式 ， 不 过 这 一 次 封装 在 一 
个 UDP 数 据 报 中 。 


20 字 节 
Pee 


UDP 首部 8 


unsigned int xid 事务 ID ( XID ) 4 


enum msg type 消息 类 型 ( 1= 应 答 ) 4 
enum reply stat| ”应答 状态 ( 0= 已 接受 ) 4 
enum auth flavor 认证 形式 4 


rpc msg() 验证 器 长 度 4 


reply body() verf 
opaque body<400> m" 
Dena 7-1 =) 
验证 器 数据 最 多 400 


accepted reply{} 


enum accept stat 接受 状态 ( 0= 成 功 ) 4 


过 程 结 果 


图 16-32 封装 为 一 个 UDP 数据 报 的 成 功 的 RPC 应 答 
我 们 现在 给 出 取 目 RFC 1831 的 一 个 RPC 应 管 的 真正 XDR 说 明 书 。 
enum reply_stat { 

MSG ACCEPTED = 0; 

MSG DENIED=0 


js 

enum accept. stat | 
SUCCESS = 0, /* RPC executed successfully */ 
PROG UNAVAIL  - 1, /* program £ unavailable */ 


PROG MISMATCH - 2, 
PROC UNAVAIL =3, 

GARBAGE ARGS =4, 
SYSTEM ERR ..5 


/* version # unavailable */ 
/* procedure # unavailable */ 


/* cannot decode arguments */ 


./.memor.allocatio.failure,etc.*/ 


struct accepted reply 1 
opaque auth verf; 
union switch (accept. stat stat)1 
case SUCCESS: 


opaque results[0]; /* procedure-specific results start here */ 
case PROG_MISMATCH: 
struct 1 


unsigned int low;  /* lowest version # supported */ 
unsigned int high; /* highest version # supported */ 


) mismatch info; 


default: /* 
PROG_UNAVAIL,PROC_UNAVAIL,GARBAGE_ARGS,SYSTEM_ER 
R */ 
void; 


} reply_data; 
F 
union reply_body switch (reply_stat stat){ 
case MSG_ACCEPTED: 
accepted_reply areply; 
case MSG_DENIED: 
rejected_reply rreply; 
} reply; 
如 果 RPC 版 本 号 有 误 ， 或 者 发 生 认 证 错误 ， 服 务 器 就 可 能 拒绝 调 
用 请 求 。 
enum reject. stat | 
RPC MISMATCH - 0, /* RPC version number not 2 */ 
AUTH ERROR 7-71 /* authentication error */ 


*/ 


h 


enum auth stat { 


AUTH OK =0, /* success */ 
/* following are failures at server end */ 
AUTH_BADCRED =1, /* bad credential (seal broken)*/ 
AUTH REJECTEDCRED = 2, q /* client must begin new session 
AUTH_BADVERF = 3, /* bad verifier (seal broken)*/ 
AUTH REJECTEDVERF = 4, /* verifier expired or replayed */ 
AUTH_TOOWEAK =5, /* rejected for security reasons */ 
/* following are failures at client end */ 
AUTH INVALIDRESP =6, /* bogus response verifier */ 
AUTH FAILED =7 /* reason unknown */ 
R 


union rejected_reply switch (reject_stat stat){ 
case RPC_MISMATCH: 
struct { 
unsigned int low; /* lowest RPC version £ supported */ 
unsigned int high; /* highest RPC version # supported */ 
) mismatch info; 
case AUTH ERROR: 


auth stat stat; 


16.10 小 结 


Sun RPC 人 允许 我 们 编写 分 布 式 应 用 程序 ， 让 客户 运行 在 一 台 主 机 
上 ， 服 务 器 运行 在 另 一 台 主 机 上 。 我 们 首先 定义 了 客户 能 够 调用 的 服 
务 器 过 程 ， 然 后 编写 了 一 个 描述 这 些 过 程 的 参数 和 返回 值 的 RPC 说 明 
书 文件 。 我 们 接着 编写 了 调用 服务 器 过 程 的 客户 程序 main 范 数 以 及 服 
务 器 过 程 本 身 。 客 户 程 序 的 代码 看 起 来 只 是 简单 地 调用 服务 器 过 程 ， 
但 在 其 背后 ， 各 种 各 样 的 RPC 运 行 时 例 程 隐藏 了 网 络 通信 正在 发 生 的 
事实 。 

rpcgen 程 序 是 构建 使 用 RPC 的 应 用 程序 的 一 个 基本 工具 。 它 读 入 我 
们 的 说 明 书 文件 ， 产 生 客户 程序 存根 和 服务 器 程序 存根 ， 同 时 产生 调 
用 所 需 XDR 运 行 时 例 程 以 处 理 所 有 数据 转换 的 函数 。XDR 运 行 时 系统 
也 是 构建 使 用 RPC 的 应 用 程序 过 程 中 的 一 个 基本 部 件 。XDR 定 义 了 在 
不 同 的 系统 间 交 换 各 种 数据 格式 的 一 种 标准 方法 ， 这 些 系统 可 能 具有 
不 同 的 整数 大 小 、 不 同 的 字 节 序 、 不 同 的 浮 点 数 格式 等 。 正 如 我 们 所 
示 的 那样 ，XDR 可 独立 于 RPC 软 件 包 单独 使 用 ， 其 目的 纯粹 是 为 了 以 
一 种 标准 的 格式 交换 数据 ， 而 数据 的 交换 可 以 使 用 任意 形式 的 真正 传 
送 数据 的 通信 手段 〈 例 如 使 用 套 接 字 或 XTI 编 写 的 程序 、 软 盘 、CD- 
ROM 等 ) 。 

Sun RPC 提 供 了 自己 的 命名 形式 ， 这 种 命名 使 用 32 位 程序 号 、32 位 
版 本 号 和 32 位 过 程 号 。 运 行 一 个 RPC 服 务 器 的 每 台 主 机 必须 运行 一 个 
名 为 端口 映射 器 (现在 称 为 RPCBIND) 的 程序 。RPC 服 务 器 捆绑 临时 
的 TCP 和 UDP 端口 后 向 端口 映射 器 注册 ， 从 而 把 这 些 临 时 端口 与 由 服务 
器 提供 的 程序 号 和 版 本 号 关联 起 来 。 当 一 个 RPC 客 户 启动 时 ， 它 首先 
跟 服务 器 主机 上 的 端口 映射 器 联系 以 获取 所 需 的 端口 号 ， 然 后 跟 服务 
器 本 身 联系 ， 通 常情 况 下 要 么 使 用 TCP， 要 么 使 用 UDP。 

默认 情况 下 ，RPC 客 户 不 提供 任何 认证 信息 ，RPC 服 务 器 则 处 理 所 
收 到 的 任何 客户 请 求 。 这 跟 我 们 使 用 套 接 字 或 XTI 编 写 自己 的 客户 - 服 
务 器 程序 一 样 。Sun RPC 提 供 了 另外 三 种 认证 形式 : Unix 认 证 (提供 客 


户 的 主机 名 、 用 户 ID 和 组 ID) 、DES 认 证 〈 基 于 私 铀 和 公 钥 加 密 技 
术 ) 和 Kerberos 认 证 。 

理解 作为 底层 支撑 的 RPC 软 件 包 中 的 超时 和 重 传 策略 对 于 使 用 RPC 

(或 进行 任何 形式 的 网 络 编程 ) 至 关 重 要 。 当 使 用 诸如 TCP 这 样 的 可 靠 

传输 层 时 ，RPC 客 户 只 需要 一 个 总 超时 ， 因 为 任何 丢失 或 重复 的 分 组 
都 是 由 传输 层 完 全 处 理 的 。 然 而 当 使 用 诸如 UDP 这 样 的 不 可 靠 传 输 层 
时 ， 除 总 超时 外 ，RPC 软 件 包 还 有 一 个 重 试 超时 。RPC 客 户 使 用 事务 ID 
来 验证 某 个 接收 到 的 应 答 是 所 期 望 的 应 答 。 

任何 过 程 调用 可 划 归 为 具有 正好 一 次 语义 、 最 多 一 次 语义 或 最 少 
一 次 语义 。 对 于 本 地 过 程 调用 ， 我 们 通常 忽略 这 些 问题 ， 但 是 对 于 
RPC， 我 们 必须 清楚 这 几 种 语义 的 差异 ， 并 理解 等 势 过 程 (能 够 不 出 
问题 地 调用 任意 多 次 的 过 程 ) 和 非 等 势 过 程 (必须 只 调用 一 次 的 过 
程 ) 之 间 的 差别 。 

Sun RPC 是 一 个 庞大 的 软件 包 ， 而 我 们 只 是 触及 了 它 的 皮毛 而 已 。 
不 过 有 了 本 章 中 讨论 的 基本 知识 后 ， 就 能 编写 出 完整 的 应 用 程序 。 
rpcgen 的 使 用 隐藏 了 许多 细节 ， 并 简化 了 代码 编写 工作 。Sun 的 手册 中 
把 使 用 RPC 的 代码 编写 工作 划分 成 多 个 级 别 一 一 简化 的 接口 、 顶 级 、 
中 间 级 、 专 家 级 和 底 级 ， 不 过 这 样 的 划分 毫 无 意义 。RPC 运 行 时 系统 
总 共 提 供 164 个 函数 ， 划 分 成 以 下 六 类 : 

11 个 auth_ 函数 〈 认 证 ) ; 

26/clnt WAX (客户 方 ) ; 

5 个 pmap_ PNAC (端口 映射 器 访问 ) ; 

24 个 rpc_ 函数 (一 般 性 ) ; 

44 个 svc_ 画 数 (服务 器 方 ) ; 

54 个 xdr 函 数 (XDR 和 转换) 。 

比较 一 下 ， 套 接 字 API 和 XTI API 分 别 有 约 25 个 函数 ， 门 API、 
Posix 和 System V 各 自 的 消息 队列 API、 信 和 号 量 API 和 共享 内 存 区 API 分 
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量 的 函数 有 10 个 ， 处 理 Posix 读 写 锁 的 函数 有 11 个 ， 处 理 fcnti 记 录 上 锁 
的 函数 只 有 1 个 。 


习题 


16.1 当局 动 某 个 RPC 服 务 需 时 ， 写 回 端 口 映 射 需 注册 其 目 号 。 如 
果 终 止 该 服务 器 ( 壁 如 说 使 用 终端 中 断 键 ) ， 那 么 它 的 注册 会 有 什么 
变化 ? 如 果 发 往 该 服务 器 的 某 个 客户 请 求 在 此 后 某 个 时 刻 到 达 ， 那 会 
发 生 什 么 ? 

16.2 假设 有 一 个 基于 UDP 使 用 RPC 的 客户 -服务 器 系统 ， 它 没有 服 
务 器 应 答 高 速 缓存。 客户 发 送 一 个 请 求 给 服务 器 ， 但 是 服务 器 将 其 应 
答 发 回 要 花 20 秒 。 客 户 在 15 秒 后 超时 ， 导 致 服务 器 过 程 被 再 次 调用 。 

该 服务 器 的 第 二 个 应 答 将 发 生 什 么 ? 

16.3 XDR 的 string 数 据 类 型 总 是 编码 成 在 一 个 长 度 之 后 跟 以 其 各 个 
字符 。 如 果 我 们 想 要 定 长 的 字符 串 ， 壁 如 说 以 char c[10] fV string 
s<10>， 那 么 需 做 哪些 变动 ? 

16.4 把 图 16-16 中 string 的 最 大 大 小 由 128 改 为 10， 然 后 运行 write 程 
FR. 发生 了 什么 ? 现在 把 最 大 长 度 指 定 符 从 string 声 明 中 去 掉 ， 也 就 是 
说 写成 string vstring_arg<>， 比 较 修 改 前 后 分 别 产 生 的 data_xdr.c 文 件 ， 
有 什么 变化 ? 

16.5 把 图 16-18 中 xdrmem_create 的 第 三 个 参数 (缓冲 区 大 小 ) BAN 
50， 看 发 生 了 什么 。 

16.6 在 16.5 廊 中 我 们 讲述 了 当 使 用 UDP 时 可 被 启用 的 重复 请 求 高 速 
缓存 。 我 们 可 以 说 TCP 维 护 着 自己 的 重复 请 求 高 速 缓存。 这 具体 指 什 
么 ， 男 外 这 个 TCP 重 复 请 求 高 速 缓存 有 多 大 ? (提示: TCP 是 如 何 检 测 
收 到 重复 数据 的 ? ) 


16.7 给 定 唯 一 标识 服务 器 重复 请 求 高 速 缓 存 中 每 一 项 的 那 5 个 元 
素 ， 当 比较 某 个 新 的 请 求 和 高 速 绥 存 中 各 个 项 时 ， 这 5 个 值 以 怎样 的 顺 
序 进行 比较 所 需 比 较 次 数 最 少 ? 

16.8 观察 16.5 节 中 使 用 TCP 的 客户 -服务 器 系统 的 真正 分 组 传递 ， 
可 看 到 请 求 分 节 的 大 小 为 48 字 节 ， 应 答 分 节 的 大 小 为 32 字 节 (忽略 
IPv4 首 部 和 TCP 首 部 ) 。 分 析 这 两 个 大 小 〈 例 如 如 图 16-30 和 图 16-32 那 
样 ) 。 

如 果 改 用 UDP 代替 TCP， 那 么 这 两 个 大 小 是 多 少 ? 

16.9 在 不 支持 线程 的 系统 上 的 RPC 客 户 能 调用 编译 成 支持 线程 的 
服务 器 过 程 吗 ? 我 们 在 16.2 节 中 叙述 的 调用 参数 上 的 差异 情况 怎么 样 ? 

16.10 在 图 16-19 的 read 程 序 中 ， 我 们 分 配 读 入 文件 用 的 缓冲 区 空 
间 ， 而 该 缓冲 区 中 含有 指针 vstring_arg。 请问 由 vstring_arg 所 指 的 字符 
串 存 放 在 哪儿 ? 修改 该 程序 以 验证 你 的 假设 。 

16.11 Sun RPC 把 空 过 程 (null procedure) 定义 为 过 程 号 为 0 的 过 程 
(这 就 是 我 们 总 是 以 1 开始 过 程 编号 的 原因 ， 如 图 16-1 所 示 ) 。 另 外 ， 
由 rpcgen 生 成 的 每 个 服务 器 存根 自动 定义 该 过 程 (这 一 点 只 需 查 看 由 本 
章 中 的 例子 生成 的 任何 服务 器 存根 就 能 轻而易举 地 验证 ) 。 空 过 程 不 
需要 参数 ， 也 不 返回 东西 ， 往 往 用 于 验证 给 定 服务 器 正在 运行 ， 或 者 

测量 到 服务 器 的 往返 时 间 。 然 而 要 是 我 们 查看 客户 存根 ， 

那么 会 发 现 rpcgen 并 没有 给 空 过 程 产生 存根 。 查 看 clnt_call 函 数 的 
手册 页 面 ， 并 用 它 来 对 本 章 中 给 出 的 任意 一 个 服务 器 调用 空 过 程 。 

16.12 图 A-2 中 对 于 使 用 UDP 的 Sun RPC 来 说 ， 为 什么 不 存在 消息 大 
小 为 65536 的 项 ? 图 A-4 中 对 于 使 用 UDP 的 Sun RPC 来 说 ， 为 什么 不 存在 
消息 大 小 为 16384 和 32768 的 项 ? 

16.13 验证 在 图 16-19 中 省 略 xdr free 调 用 将 引入 内 存 空间 泄漏 

(memory leak) 。 在 调用 xdrmem_create 的 紧 前 插入 以 下 语句 : 
for ( ; ; ){ 


再 把 配对 的 右 花 括 弧 放 在 调用 xdr_free 的 紧 前 。 运 行 该 程序 ， 使 用 
ps 观察 它 的 内 存 空间 大 小 。 然 后 把 配对 的 右 花 括 弧 改 放 到 调用 xdr_free 
之 后 ， 再 运行 该 程序 ， 观 察 它 的 内 存 空 间 大 小 。 


[1], Linux E] J O SCHWRSURL EHRE T hetp://www.rampant.org/doors/ 
中 o 


[2]. SUID 是 可 执行 文件 的 一 个 权限 位 。 设 置 了 该 位 的 可 执行 文件 运行 
时 ， 相 应 进程 的 有 效用 户 ID 就 设置 成 该 文件 的 属 主 (本 例子 中 就 是 
root) ， 从 而 可 达到 获取 原本 没有 的 特权 之 目的 。 典 型 的 SUID 程 序 是 
修改 口令 用 的 passwd (路 径 名 通常 为 /bin/passwd 或 /usr/bin/passwd， 注 
意 与 /etc/passwd 区 分 开 ) ， 该 文件 的 属 主 为 root。 当 普通 用 户 执行 
passwd 程 序 时 ， 实 际 上 和 暂时 取得 了 超级 用 户 的 特权 ， 能 够 修改 原本 只 
能 读 的 /etc/passwd 文 件 ， 不 过 程序 代码 控制 着 具体 的 操作 ， 使 得 有 恶意 
的 用 户 不 能 胡作非为 。 BEBE 
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[4]. 这 里 涉及 有 关 线 程 的 不 少 概念 。 首 移 ， 我 们 必须 区 分 并 发 
(concurrency) 和 并 行 (parallelism) 。 一 个 多 处 理 机 应 用 程序 运行 时 
的 并 行 度 是 实际 达到 的 并 行 执 行程 度 ， 因 此 受 限 于 其 进程 可 用 的 物理 
处 理 器 数 。 该 应 用 程序 的 并 发 度 则 是 在 处 理 器 数 无 限 的 理想 前 提 下 所 
能 达到 的 最 大 并 行 度 。 其 次 ， 并 发 既 可 在 系统 级 提供 ， 也 可 在 用 户 级 
提供 。 内 核 通 过 认 知 一 个 进程 内 的 多 个 线程 “也 称 为 热线 程 ) 并 独立 
地 调度 它们 来 提供 系统 级 并 发 。 内 核 然 后 把 这 些 线程 复 用 到 可 用 的 处 
理 器 上。 用 户 级 并 发 则 由 应 用 程序 通过 用 户 级 线程 库 提 供 。 内 核 不 认 
得 这 样 的 用 户 线程 〈 也 称 为 冷 线程 ) ， 因 而 必须 由 用 户 级 线程 库 管 理 
和 调度 。 许 多 系统 (包括 提供 门 API 的 Solaris 2.6) 实现 了 把 两 者 结合 
起 来 的 双 并 发 模型 .内核 认得 一 个 进程 内 的 多 个 线程 ， 线 程 库 则 支持 
不 为 内 核 所 见 的 用 户 线程 。 再 次 ，Solaris 2.x 文 持 内 核 线程 
(kernelthread) 、 轻 权 进 程 (lightweight process) 和 和 用户 线程 
(userthread) 。 内 核 线程 是 能 够 被 独立 地 调度 和 派 遗 到 某 个 系统 处 理 
器 上 运行 的 基本 轻 权 对 象 。 它 不 必 与 一 个 用 户 进 程 相 关联 ， 是 由 内 核 
根据 内 部 需要 创建 、 运 行 或 毁 除 以 执行 指定 的 功能 的 。 内 核 线程 对 于 
应 用 程序 不 可 见 。 轻 权 进 程 是 内 核 支 持 的 用 户 可 见 线程 ， 属 于 热线 
程 。 它 基于 内 核 线 程 ， 实 际 上 每 个 轻 权 进程 绑 定 在 各 目的 内 核 线程 


上 。 用 户 线程 是 由 线程 库 实 现 的 内 核 不 可 见 的 更 高 级 对 象 ， 属 于 冷 线 
程 。 这 是 用 户 直 接 看 到 的 线程 。 最 后 ， 一 个 进程 内 有 两 类 用 户 线程 ; 

一 类 是 绑 定 在 某 个 轻 权 进程 上 的 线程 ， 一 类 是 共享 公共 的 轻 权 进程 池 
的 未 绑 定 线程 。 竞 用 范围 为 PTHREAD_SCOPE SYSTEM 的 线程 属于 绑 
EHRE, JgJPTHREAD SCOPE PROCESS 的 线程 属于 未 绑 定 的 线 

程 。 译 者 注 


[5]. 此 处 为 UNPv1 第 2 版 英文 原版 书 世 号， 第 3 版 为 12.4 丰 。 一 mA t 
[6]. 此 处 为 UNPv1 第 2 版 英文 原版 书 和 号， 第 3 版 为 13.5 世 。 一 一 编 者 注 
[7]. 此 处 为 UNPVv1 第 2 版 美文 原版 书 图 号 ， 第 3 版 为 图 13-7。 一 一 编者 注 


[8]. 此 处 为 UNPv1 第 2 版 英文 原版 书页 码 ， 第 3 版 为 第 77~80 页 和 人 第 147 
一 150 页 。 一 一 编者 注 
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后 记 


本 书 详细 讲述 了 用 于 进程 间 通 信 (IPC) 的 四 种 不 同 技术 : 
(1) 消 息 传递 (管道 、FIFO、Posix 和 System V 消 息 队 列 ) ; 
DEHE ( 互 斥 锁 、 条 件 变 量 、 读 写 锁 、 文 件 和 记录 锁 、Posix 和 


System Via SH) ; 
(3) 共 享 内 存 区 (匿名 共享 内 存 区 、 有 名 Posix 共 享 内 存 区 、 有 名 
System V 共 享 内 存 区 ) ; 


(4) 过 程 调用 (Solaris) ] Sun RPC) ° 

消息 队列 和 过 程 调用 往往 单独 使 用 ， 也 就 是 说 它们 通常 提供 了 自 
己 的 同步 机 制 。 相 反 ， 共 享 内 存 区 通常 需要 某 种 由 应 用 程序 提供 的 同 
步 形式 才能 正确 工作 。 同 步 技术 有 时 候 单 独 使 用 ， 也 就 是 说 不 涉及 其 
他 形式 的 IPC。 

讨论 了 共 16 章 的 细节 后 ， 很 显然 的 一 个 问题 是 : 解决 某 个 特定 问 
题 应 使 用 哪 种 形式 的 IPC? 遗憾 的 是 不 存在 关于 IPC 的 简单 判定 。Unix 
提供 的 类 型 如 此 之 多 的 IPC 表 明 ， 不 存在 解决 全 部 (或 者 甚至 于 大 部 
Sy) 问题 的 单一 办 法 。 你 能 做 的 仅仅 是 : 逐渐 熟悉 各 种 IPC 形 式 提 供 
的 机 制 ， 然 后 根据 特定 应 用 的 要 求 比较 它们 的 特性 。 

我 们 首先 列 出 必须 考虑 的 四 个 前 提 ， 因 为 它们 对 于 你 的 应 用 程序 
相当 重要 e 

(1) 连 网 的 (networked) 还 是 非 连 网 的 (nonnetworked) 。 我 们 假 
设 已 作出 这 个 决定 ，IPC 就 是 用 于 单 台 主机 上 的 进程 或 线程 间 的 。 如 


果 应 用 程序 有 可 能 散布 到 多 台 主 机 上 ， 那 就 考 虚 使 用 套 接 字 代 替 
IPC， 从 而 简化 以 后 向 连 网 的 应 用 程序 转移 的 工作 。 

(2) 可 移植 性 (portability) 。 回 想 图 1-5， 几 乎 所 有 Unix 系 统 都 文 
持 Posix 管 道 、Posix FIFO 和 了 Posix 记 录 上 锁 。 到 了 1998 年 ， 大 多 数 Unix 
系统 支持 System V IPC. (消息 、 信 号 量 和 共享 内 存 区 ) ， 而 支持 Posix 
IPC (消息 、 信 号 量 和 共享 内 存 区 ) 的 仅 有 几 个 系统 。Posix IPC 应 该 
出 现 更 多 实现 ， 然 而 (遗憾 的 是 ) 它 在 Unix 98 中 只 是 个 选项 。 许 多 
Unix 系 统 支持 Posix 线 程 (包括 互 不 锁 和 条 件 变 量 在 内 ) ， 或 者 应 在 不 
和 久 的 将 来 支持 它们 。 有 些 支持 Posix 线 程 的 系统 不 支持 互 斥 锁 和 条 件 变 
量 的 进程 间 共 享 属 性 。Unix 98 需 要 的 读 写 锁 应 被 Posix 所 采纳 ， 而 且 许 
多 版 本 的 Unix 已 在 支持 某 种 类 型 的 读 写 锁 。 内 存 映 射 TO 得 到 广泛 文 
持 ， 大 多 数 Unix 系 统 还 提供 匿名 内 存 映 射 〈 或 者 使 用 /devwzero， 或 者 
使 用 MAP_ANON) 。 几 乎 所 有 Unix 系 统 都 可 使 用 Sun RPC， 门 则 是 
Solaris 特 有 的 特性 “到 目前 为 止 是 这 样 ) 。 

(3) 性 能 (performance) 。 如 果 性 能 是 应 用 程序 设计 中 的 一 个 关键 
前 提 ， 那 就 在 你 自己 的 系统 上 运行 附录 人 A 中 开发 的 程序 。 更 好 的 做 法 
是 ， 把 这 些 程序 修改 成 模拟 特定 应 用 的 实际 环境 ， 再 在 这 样 的 环境 中 
测量 它们 的 性 能 。 

(4) 实 时 调度 (realtime scheduling) 。 如 果 你 的 应 用 需要 这 一 特 
性 ， 而 且 你 的 系统 支持 Posix 实 时 调度 选项 ， 那 就 考虑 使 用 Posix 的 消息 
传递 和 同步 范 数 (消息 队列 、 信 号 量 、 互 不 锁 、 条 件 变 量 ) 。 举 例 来 
说 ， 当 某 个 线程 挂 出 一 个 有 多 个 线程 阻塞 在 其 上 的 信号 量 时 ， 符 解 阻 
塞 的 线程 是 以 一 种 适合 于 所 阻塞 线程 的 调度 策略 和 参数 的 方式 选择 
的 。 相 反 ，System V 信 号 量 不 能 保证 实时 调度 。 

为 帮助 理解 各 种 类 型 IPC 的 一 些 特性 和 局 限 ， 我 们 汇总 了 它们 的 
一 些 主要 差异 。 


管道 和 FIFO 是 字 和 流 ， 没 有 消息 边界 。Posix 消 息 和 System V1H I. 
则 有 从 发 送 者 向 接收 者 维护 的 记录 边界 。 (考虑 到 UNPv1 中 讲述 的 网 
际 协议 族 ，TCP 是 没有 记录 边界 的 字 节 流 ， UDP 则 提供 具有 记录 边界 
的 消息 。) 

当 有 一 个 消息 放置 到 一 个 空 队 列 中 时 ，Posix 消 息 队 列 可 辐 一 个 进 
程 发 送 一 个 信号 ， 或 者 启动 一 个 新 的 线程 。System V 消 息 队 列 不 提供 
类 似 的 通知 形式 。 这 两 种 消息 队列 都 不 能 直接 跟 select 或 poll (UNPv1 
的 第 6 章 ) 一 起 使 用 ， 不 过 我 们 分 别 在 图 5-14 和 6.9 节 中 提供 了 间接 的 
方法 。 

管道 或 FIFO 中 的 数据 字 节 是 先进 先 出 的 。Posix 消 妃 和 System V 消 
息 具 备 由 发 送 者 赋予 的 优先 级 。 从 一 个 Posix 消 息 队 列 读 出 消息 时 ， 首 
先 返回 的 总 是 具有 最 高 优先 级 的 消息 。 从 一 个 System V 消 息 队列 读 出 
时 ， 读 出 者 可 以 请 求 所 想 要 的 任意 优先 级 的 消息 。 

当 有 一 个 消息 放置 到 一 个 Posix 或 System V 消 息 队 列 ， 或 者 写 到 一 
个 管道 或 FIFO 时 ， 只 有 一 个 副本 递交 给 刚好 一 个 线程 。 这 些 IPC 形 式 
不 存在 客 探 能 力 〈 即 类 似 于 套 接 字 API 的 MSG_PEEK 标 志 ，UNPv1 的 
13.75 [1]). ， 它 们 的 消息 也 不 能 广播 或 多 播 到 多 个 接收 者 (这 对 于 使 
用 UDP 协议 的 套 接 字 程序 和 XTI 程 序 是 可 能 的 ，UNPv1 第 18 章 和 第 19 
PE) 3 

互 斥 锁 、 条 件 变量 和 读 写 锁 都 是 无 名 的 ， 也 就 是 说 它们 是 基于 内 
存 的 。 它 们 能 够 很 容易 地 在 单个 进程 内 的 不 同 线程 间 共 享 。 然 而 只 
当 它 们 存放 在 不 同 进程 间 共 享 的 内 存 区 中 时 ， 它 们 才 可 能 为 这 些 进程 
所 共享 。 而 Posix 信 号 量 就 有 两 种 形式 ， 有 名 的 和 基于 内 存 的 。 有 名 信 
号 量 总 能 在 不 同 进程 间 共享 (因为 它们 是 用 Posix IPC 名 字 标 识 的 ) ， 
基于 内 存 的 信号 量 也 能 在 不 同 进 程 间 共 享 ， 条 件 是 必须 存放 在 这 些 进 
程 间 共享 的 内 存 区 中 。System V 信 号 量 也 是 有 名 的 ， 不 过 所 用 的 是 


key_t 数 据 类 型 ， 它 往往 是 从 某 个 文件 的 路 径 名 获取 的 。 这 些 信号 量 能 
够 很 容易 地 在 不 同 进程 间 共 享 。 

如 果 持 有 某 个 锁 的 进程 没有 释放 它 就 终止 ， 内 核 就 自动 释放 fentl 
记录 锁 。System V 信 和 号 量 将 这 一 特性 作为 一 个 选项 提供 。 互 斥 锁 、 条 
件 变量 、 读 写 锁 和 Posix 信 和 号 量 不 具备 该 特性 。 

每 个 fcnt 锁 都 与 通过 其 相应 描述 符 访问 的 文件 中 的 某 个 字 节 范 围 
(我 们 称 之 为 一 个 “记录 ”) 相关 联 。 读 写 锁 则 不 与 任何 类 型 的 记录 关 
联 。 

Posi $ FN XA System V 共 享 内 存 区 都 具有 随 内 核 的 持续 性 。 
它们 一 直 存 在 到 被 显 式 地 删除 为 止 ， 即 使 当前 没有 任何 进程 在 使 用 它 
们 也 这 样 。 

Posix 共 享 内 存 区 对 象 的 大 小 可 在 其 使 用 期 间 扩 张 。System V 共 享 
内 存 区 的 大 小 则 是 在 创建 时 固定 下 来 的 。 

System V IPC 所 存在 的 三 种 内 核 限 制 往往 需要 系统 管理 员 对 它们 
进行 调整 ， 因 为 它们 的 默认 值 通 常 不 能 满足 现实 应 用 的 需要 (3.8 
T) 。Posix IPC 所 存在 的 三 种 内 核 限 制 则 通常 根本 不 需要 调整 。 

有 关 System V IPC 对 象 的 信息 (当前 大 小 、 属 主 ID、 最 后 修改 时 
间 ， 等 等 ) 可 使 用 三 个 XXXctl 函 数 的 IPC_STAT 命 令 获 取 ， 也 可 执行 
ipcs 命 令 获 取 。 有 关 Posix IPC 对 象 的 信息 则 不 存在 标准 的 获取 方式 。 
如 果 这 些 对 象 是 用 文件 系统 中 的 文件 实现 的 ， 而 且 我 们 知道 从 Posix 
IPC 名 字 到 路 径 名 的 映射 关系 ， 那 么 这 些 对 象 的 信息 可 使 用 stat 函 数 或 
1s 命 令 获取 。 但 是 如 果 这 些 对 象 不 是 使 用 文件 实现 的 ， 那 么 可 能 获取 
不 了 这 样 的 信息 。 

在 众多 的 同步 技术 一 一 互 不 锁 、 条 件 变 量 、 读 写 锁 、 记 录 锁 、 
Posix 信 号 量 和 System V 信 和 号 量 - 中， 可 从 信号 处 理 程序 中 调用 的 画 
数 (图 5-10) 只 有 sem_post 和 fcntl。 


在 众多 的 消息 传递 技术 一 一 管道 、FIFO、Posix 消 息 队 列 和 System 
V 消 息 队 列 一 -中 ， 可 从 一 个 信号 处 理 程序 中 调用 的 函数 只 有 read 和 
write (适用 于 管道 和 FIFO) 。 

在 所 有 的 消息 传递 技术 中 ， 只 有 门 向 服务 器 准确 地 提供 了 客户 的 
标识 (15.5 节 ) 。 在 5.4 节 中 我 们 提 到 过 ， 另 外 两 种 消息 传递 类 型 也 标 
识 客户 : BSD/OS 在 使 用 Unix 域 套 接 字 时 提供 这 种 标识 (UNPv1 的 14.8 
节 [2] ) ，SVR4 则 在 通过 某 个 管道 传递 一 个 描述 符 时 通过 同一 个 管道 
传递 发 送 者 的 标识 (APUE 的 15.3.1 节 ) 。 


[1]. 此 处 为 UNPVv1 第 2 版 英文 原版 书 节 号 ， 第 3 版 为 14.3 节 。 一 一 编者 注 
[2]. 此 处 为 UNPVv1 第 2 版 英文 原版 书 节 号 ， 第 3 版 为 15.2 节 。 一 一 编者 注 
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A.1 概述 

KEHE T NPP WANA Pee: 

管道 ; 

FIFO; 

Posixil A BA ZI; 

System V 消 息 队 列 ; 

`]; 

Sun RPC ° 

和 五 种 类 型 的 同步 : 

FREES 

读 写 锁 ; 

fentlid se EB; 

Posix 信 号 量 ; 

System V 信 号 量 。 

我 们 现在 开发 一 些 简单 的 程序 来 测量 这 些 IPC 类 型 的 性 能 ， 这 样 有 
助 于 我 们 束 何 时 该 使 用 某 种 特定 形式 的 IPC 做 出 明智 的 决策 。 

比较 不 同形 式 的 消息 传递 时 ， 我 们 感 兴趣 的 是 以 下 两 种 测量 尺 
度 。 

(1) 带 宽 (bandwidth) : 数据 通过 IPC 通 道 转移 的 速度 。 为 测量 该 
值 ， 我 们 从 一 个 进程 向 另 一 个 进程 发 送 大 量 数据 ( 几 百 万 字 节 ) 。 我 


们 还 给 不 同 大 小 的 VO 操作 (例如 管道 和 FIFO 的 write 和 read 操 作 ) 测量 
该 值 ， 期 符 发 现 带宽 随 每 个 UO 操 作 数 据 量 的 增长 而 增长 的 规律 。 

(2) ER (latency) : 一 个 小 的 IPC 消 息 从 一 个 进程 到 另 一 个 进程 再 
返回 所 论 的 时 间 。 我 们 测量 的 是 只 有 1 个 字 广 的 消 恩 从 一 个 进程 到 男 一 
个 进程 再 回来 的 时 间 (往返 时 间 ) 。 

在 现实 世界 中 ， 珊 览 告诉 我 们 大 块 数据 通过 一 个 IPC 通 道 发 送出 去 
需 花 多 长 时 间 ， 然 而 IPC 也 用 于 传送 小 的 控制 消息 ， 系 统 处 理 这 些小 消 
息 所 需 的 时 间 就 由 延迟 提供 。 这 两 个 数 都 很 重要 。 

为 测量 各 种 同步 形式 的 性 能 ， 我 们 来 修改 将 处 于 共享 内 存 区 中 的 
一 个 计数 器 持续 加 1 的 程序 ， 该 程序 或 者 由 多 个 线程 给 该 计数 器 每 次 加 
1， 或 者 由 多 个 进程 给 该 计数 句 每 次 加 1。 既 然 加 1 是 个 简单 的 操作 ， 
此 它 所 需 的 时 间 差 不 多 由 同步 原 语 操作 的 时 间 决 定 。 

本 附录 中 用 于 测量 各 种 形式 IPC 之 性 能 的 简单 程序 大 体 上 基于 
| McVoy and Staelin 1996 | 中 描述 的 Imbench 标 准 测量 程序 
(benchmark) 套件 。 这 是 一 套 复杂 精致 的 标准 测量 程序 ， 用 于 测量 一 

个 Unix 系 统 的 许多 特征 (上 下 文 切换 时 间 、IO 吞 吐 量 ， 等 等 ， 而 不 
光 x IPC 。 它 们 的 源 人 代码 是 公开 可 得 的 : 
http://www.bitmover.com/Imbench ° 

本 附录 中 给 出 的 各 个 数值 是 为 让 我 们 比较 本 书 中 讲述 的 各 种 技术 
而 提供 的 。 所 上 暗含 的 一 个 动机 是 展示 测量 这 些 值 是 多 么 地 简单 。 在 从 
各 种 技术 中 作出 选择 之 前 ， 你 必须 测量 自己 的 系统 的 这 些 性 能 数值 。 
不 夷 的 是 ， 就 像 测 量 数值 之 易 的 程度 一 样 ， 当 检测 到 反常 现象 时 ， 在 
没 法 访问 出 问题 的 内 核 或 函数 库 的 源 代码 的 情况 下 ,解释 起 来 往往 非常 
困难 o 

A.2 结果 

现在 汇总 出 目 本 附 孙 的 所 有 结果 ， 目 的 是 在 逐个 查看 我 们 给 出 的 
各 个 程序 的 过 程 中 提供 方便 的 指引 。 


用 于 所 有 测量 的 两 个 系统 是 运行 Solaris 2.6 的 一 台 SparcStation 4/110 
和 运行 Digital Unix 4.0B 的 一 台 Digital Alpha (DEC 3000 型 号 300 , 
Pelican) 。 往 该 Solaris 系 统 的 /etc/system 文 件 中 添加 了 以 下 各 行 : 

set msgsys:msginfo msgmax = 16384 

set msgsys:msginfo msgmnb - 32768 

set msgsys:msginfo msgseg = 4096 

这 样 允 许 在 System V 消 息 队 列 中 出 现 大 小 为 16384 字 节 的 消息 〈 图 
A-2) 。 通 过 作为 sysconfig 程 序 的 输入 指定 以 下 各 行 ， 对 该 Digital Unix 
系统 进行 同样 的 修改 : 

ipc: 

msg-max = 16384 
msg-mnb = 32768 

A.2.1 消息 传递 带宽 结果 

图 A-2 列 出 了 在 运行 Solaris 2.6 的 一 台 Sparc 主 机 上 测 得 的 带宽 结 
有 果 ， 图 A-3 图 示 了 这 些 值 。 图 A-4 列 出 了 在 运行 Digital Unix 4.0B 的 一 台 
Alpha 主 机 上 测 得 的 市 览 结果 ， 图 A-5 图 示 了 这 些 值 。 

正如 我 们 可 能 预期 的 那样 ， 市 宽 通 第 随 背 轧 大 小 的 增长 而 增长 。 
由 于 System V 消 息 队 列 的 实现 具有 较 小 的 内 核 限 制 值 (3.877) ， 因 此 
最 大 的 消息 是 16384 字 方 ， 而 且 即 使 对 于 这 个 大 小 的 消息 ， 内 核 默认 值 
也 不 得 不 增加 。Solaris 系 统 的 带宽 在 4096 字 和 以 上 时 减 小 的 可 能 原因 在 
于 内 部 消息 队列 限制 的 配置 。 为 跟 UNPv1 比 较 ， 我 们 还 给 出 了 TCP 套 接 
字 和 Unix 域 套 接 字 的 值 。 这 两 个 值 是 使 用 Imbench 软 件 包 中 的 程序 测 得 
的 ， 只 使 用 了 大 小 为 65536 字 市 的 一 种 消 轧 。 对 于 TCP 套 接 子 的 测量 ， 
它 的 两 个 进程 处 于 同一 台 主 机 中 。 

A.2.2 消息 传递 延迟 结果 

图 A-1 列 出 了 在 Solaris 2.6 和 Digital Unix 4.0B 下 测 得 的 延迟 结果 © 


管道 Posix 消 | System V pj | Sun RPC | Sun RPC TCP UDP | Unix 域 
“| 息 队列 | 消息 队列 TCP UDP | 套 接 字 | 套 接 字 | 套 接 字 


Solaris2.6 | 324 | 584 260 121 | 1891 1677 798 | 755 465 
DUnix40B | 574 | 995 625 1648 1373 848 | 639 289 
图 A-1 使 用 各 种 形式 的 IPC 交 换 一 个 1 字 节 消息 的 延迟 
在 A.4 世 中 我 们 将 给 出 测量 其 中 前 6 个 值 的 程序 ， 剩 下 3 个 值 则 出 上 自 
Imbench 套 件 。 对 于 TCP 和 UDP 的 测量 ， 它 们 的 两 个 进程 都 处 于 同一 台 
ESI 


带宽 (MB/s) 


Posix System V Sun RPC | Sun RPC TCP Unix 域 
消息 队列 | 消息 队列 TCP | | PF | 消息 队列 | 消息 队列 | ” | TCP | UDP | £T | ERF 


图 A-2 各 种 类 型 消息 传递 的 带宽 (Solaris 2.6) 
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图 A-3 各 种 类 型 消息 传递 的 带宽 (Solaris 2.6) 
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图 A-4 各 种 类 型 消息 传递 的 带宽 (Digital Unix 4.0B) 
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图 A-5 各 种 类 型 消息 传递 的 带宽 (Digital Unix 4.0B) 

A.2.3 线程 同步 结果 

图 A-6 列 出 了 Solaris 2.6 下 使 用 各 种 形式 的 同步 ， 由 一 个 或 多 个 线程 
给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 ， 图 A-7 图 示 了 
这 些 值 。 每 个 线程 给 该 计数 器 加 1 共 1 000 000 次 ， 这 样 的 线程 数 则 从 1 
到 5 变化 。 图 A-8 列 出 了 Digital Unix 4.0B 下 的 这 些 值 ， 图 A-9 图 示 了 这 些 
值 。 

增加 线程 数 的 原因 在 于 验证 使 用 同步 技术 的 代码 是 正确 的 ， 并 得 
看 时 间 是 否 随 线程 数 的 增加 而 开始 非 线 性 地 增长 。 对 于 fcntl 记 录 上 锁 我 
们 只 能 测量 单个 线程 ， 因 为 这 种 同步 形式 工作 于 进程 间 ， 而 不 是 单个 
进程 内 的 多 个 线程 间 。 

Digital Unix 下 ， 线 程 数 多 于 一 个 时 两 种 Posix 信 号 量 类 型 的 时 间 变 
得 非常 大 ， 表 明 存 在 某 种 类 型 的 反常 。 我 们 没有 图 示 这 些 值 。 


出 现 这 些 比 预 期 值 大 的 数值 的 可 能 原因 之 一 是 ， 本 程序 是 一 个 病 
态 的 同步 测试 程序 。 也 就 是 说 ， 各 个 线程 除 同步 外 什么 都 不 干 ， 因 而 
其 中 的 锁 基 本 上 所 有 时 间 都 为 某 个 线程 所 锁 住 。 既 然 默认 情况 下 线程 
是 以 进程 竞 用 范围 属性 创建 的 ， 因 此 每 当 一 个 线程 失去 它 的 时 间 片 
时 ， 它 可 能 仍 持 有 该 锁 ， 于 是 切换 来 运行 的 新 线程 可 能 立即 阻塞 。 
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图 A-6 给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Solaris 2.6) 
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图 A-7 给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Solaris 2.6) 


给 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 时 间 Cs) 


Posix Posix 基 于 内 存 | Posix 有 名 | System V 带 UNDo 的 
互 斥 锁 信和 号 量 信号 量 信号 量 ”|System V 信 号 量 | 记录 上 锁 
] 2.9 12.9 132 14.2 26.6 46.6 96.4 
2 11.4 40.8 742.5 771.6 54.9 93.9 
3 28.4 73.2 1080.5 1074.7 84.5 141.9 
4 49.3 95.0 1534.1 1502.2 109.9 188.4 
5 67.3 126.3 1923.3 1764.1 137.3 233.6 
图 A-8 给 处 了 
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A.2.4 进程 同步 结果 

图 A-6、 图 A-7、 图 A-8 和 图 A-9 展 示 了 各 种 同步 技术 用 于 同步 单个 
进程 内 的 各 个 线程 时 测 得 的 结果 。 图 A-10 和 图 A-11 给 出 了 Solaris 2.6 下 
在 不 同 进程 间 共 享 计数 器 时 这 些 同步 技术 的 性 能 。 图 A-12 和 图 A-13 给 
出 了 Digital Unix 4.0B 下 的 进程 同步 结果 。 这 些 结果 与 对 应 的 线程 同步 
结果 类 似 ， 不 过 两 种 Posix 信 号 量 形 式 的 值 现在 类 似 于 Solaris 的 结果 。 
我 们 只 画 出 了 fentl 记 录 上 锁 的 第 一 个 值 ， 因 为 其 余 各 值 太 大 了 。 正 如 我 


FP 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Digital Unix 4.0B) 


fl] 472 7 FTE Hi By 35 TÉ , Digital Unix 40B ^^ x FF 
PTHREAD_PROCESS_SHARED 特 性 ， 因 此 我 们 无 法 测量 不 同 进 程 间 
的 互 斥 锁 值 。 在 Digital Unix 下 当 涉 及 多 个 进程 时 ， 我 们 再 次 看 到 了 
Posix 信 号 量 的 某 种 类 型 的 反常 。 


给 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 时 间 Cs) 
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图 A-10 给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Solaris 2.6) 


图 A-11 给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Solaris 2.6) 
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图 A-12 给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Digital Unix 4.0B) 
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图 A-13 给 处 于 共享 内 存 区 中 的 一 个 计数 器 持续 加 1 所 需 的 时 间 (Digital Unix 4.0B) 

A.3 消息 传递 带宽 程序 

本 市 给 出 测量 管道 、Posix 消 息 队 列 、System Vil EA 7| ` ]fllsun 
RPC 的 带宽 的 各 个 程序 。 我 们 已 在 图 A-2 和 图 A-3 中 给 出 了 这 些 程序 的 
结果 。 

A.3.1 管道 带宽 程序 
图 A-14 展 示 了 我 们 将 描述 的 程序 的 概貌 。 


图 A-15 给 出 了 我 们 的 bw_pipe 程 序 的 前 半 部 分 ， 它 测量 一 个 管道 的 


父 进程 


main( ) 


( 


Pipe (contpipe); 
Pipe (datapipe); 
if (Fork() == O) 


) 
reader( ); 
exit(0); 


reader( ) 


( 


Write(contpipe[1], ) 
while (more to receive) 


Read(datapipe[0], 


i 


); 


if (Fork() == 


writer( ); 
exit(0); 


Read(contpipe[0], ); 
while (more to send) 


图 A-14 测量 


道 的 带 寓 的 程序 的 概貌 


Write(datapipe[1], 


); 


bench/bw pipe.c 


#include "unpipc.h" 

void reader(int, int, int); 
void writer(int, int); 

void *buf ; 

int totalnbytes, xfersize; 
int 


main(int argc, char **argv) 


int i, nloop, contpipe[2], datapipe[2]; 
pidt childpid; 
if (argc != 4) 
err quit ("usage: bw pipe <#loops> <#mbytes> <#bytes/write>") ; 
nloop = atoi(argv[1]) ; 
totalnbytes = atoi(argv[2]) * 1024 * 1024; 
xfersize = atoi(argv[3]); 


buf = Valloc(xfersize) ; 

Touch (buf, xfersize) ; 

Pipe (contpipe) ; 

Pipe (datapipe) ; 

if ( (childpid = Fork()) == 0) { 
writer (contpipe[0], datapipe[1]) ; /* child */ 
exit (0); 


/* parent */ 
Start time(); 
for (i = 0; i < nloop; i++) 

reader (contpipe[1], datapipe[0], totalnbytes) ; 
printf ("bandwidth: $.3f MB/sec\n", 

totalnbytes / Stop time() * nloop) ; 

kill(childpid, SIGTERM); 
exit(0); 


bench/bw pipe.c 


5) 


图 A-15 -NE E 9600 ER main ER 


命令 行 参数 
117-15 命令 行 参数 指定 待 执行 的 循环 数 (以 下 测量 中 的 典型 值 为 


、 待 传送 的 M 字 节 [1] 数 〈 值 为 10 的 参数 导致 传送 10x1024x1024 字 


T) 以 及 每 次 write 和 read 的 字 市 数 (我 们 给 出 的 测量 结果 中 该 值 在 1024 
和 65536 之 间 变 化 ) 。 

分 配 缓冲 区 并 触及 它 的 各 个 页 面 

167-17 valloc 是 malloc 的 版 本 之 一 ， 它 从 某 个 页 面 边界 开始 分 配 所 
请 求 数量 的 内 存 空间 。 我 们 的 函数 touch (图 A-17) 在 该 缓冲 区 的 每 个 


页 面 中 存 入 1 字 市 的 数据 ， 从 而 担 使 内 核 把 构成 该 缓冲 区 的 每 个 页 面 置 
换 进 内 存 。 我 们 在 进行 计时 之 前 完成 这 些 工作 。 

valloc/^J& T Posix.1 E424, Unix 98 把 它 列 为 一 个 “ 代 传 (legacy) " 
接口 : 早期 版 本 的 X/Open 规范 需要 它 ， 但 它 现 在 是 可 选 的 。 如 有 果 valloc 
不 受 文 持 ， 我 们 的 Valloc 包 囊 函 数 殉 调用 malloc 来 实现 它 的 功能 。 

创建 两 个 管道 

18--19 创建 两 个 管道 ， 其 中 contpipe[0] 和 contpipe[1] 用 于 在 开始 每 
次 传送 之 前 同步 一 读 一 写 两 个 进程 ，datapipe[0] 和 datapipe[1] 用 于 真正 
的 数据 传送 。 

调用 fork 派 生子 进程 

20~31 行 派生 一 个 子 进 程 ， 该 子 进程 〈 它 的 fork 返 回 值 为 0) 调用 
writer RAL, SCE REI JE H reader ER 2X o A2 Ff rn reader ER 2X VA] FA nloop 
次 。 我 们 的 start_time 函 数 在 该 循环 开始 前 即刻 调用 ， 我 们 的 stop_time 
函数 在 该 循环 终止 后 马上 调用 。 图 A-17 给 出 了 这 两 个 函数 。 所 输出 的 
带宽 为 每 次 循环 传送 的 总 字 万 数 除 以 传送 数据 所 花 的 时 间 (stop. time 
返回 的 是 自 调 用 start_time 以 来 流逝 的 微 秒 数 ) ， 再 乘 以 循环 次 数 。 子 
进程 随后 被 父 进程 发 送 的 SIGTERM 信 和 号 杀 死 ， 程 序 随后 终止 。 

图 A-16 给 出 了 bw_pipe 程 序 的 后 半 部 分 ， 它 包含 两 个 函数 writer 和 


reader ? 


bench/bw pipe.c 


33 void 

34 writer(int contfd, int datafd) 

35 ( 

36 int ntowrite; 

37 fond A 

38 Read(contfd, &ntowrite, sizeof (ntowrite)); 
39 while (ntowrite > 0) { 

40 Write(datafd, buf, xfersize); 
41 ntowrite -- xfersize; 

42 } 

43 } 

44 } 

45 void 

46 reader(int contfd, int datafd, int nbytes) 
47 { 

48 ssize t n; 

49 Write(contfd, &nbytes, sizeof (nbytes) ) ; 
50 while ((nbytes > 0) && 

51 ( (n = Read(datafd, buf, xfersize)) > 0)) { 
52 nbytes -= n; 

53 } 

54 } 


bench/bw pipe.c 


图 A-16 Jl s — 1 I AY i FE JwriterTlreaderER Zi 


writer Hal 

33~44 本 函数 是 由 子 进程 调用 的 一 个 无 限 循环 。 子 进程 通过 在 欣 
制 管 道 读 出 一 个 整数 (该 整数 指定 子 进程 应 写 入 数据 管道 的 字 节 
数 ) ， 来 等 待 父 进程 表明 自身 已 准备 好 接收 数据 。 接 收 到 这 个 通知 
， 子 进程 通过 管道 癌 父 进程 写 入 数据 ， 每 次 write 调用 写 xfersize 个 字 


o 


dt n 


reader HU 

45~54 本 函数 是 由 父 进 程 在 一 个 循环 中 调用 的 。 它 每 次 被 调 用 时 
往 控制 管道 写 入 一 个 整数 ， 告 诉 子 进程 应 往 数 据 管 道中 写 入 多 少 字 市 
的 数据 。 本 函数 随后 在 一 个 循环 中 调用 read， 直 到 全 部 数据 都 接收 完 为 
上 o 

图 A-17 给 出 了 我 们 的 start_time、stop_time 和 touch 函 数 。 


1 #include "unpipc.h" 

2 static struct timeval tv start, tv stop; 
3 int 

4 start time (void) 

5 { 

6 return(gettimeofday(&tv start, NULL) ) ; 
7} 

8 double 

9 stop time (void) 

10 ( 

11 double clockus; 

12 if (gettimeofday(&tv stop, NULL) -- -1) 
13 return(0.0); 

14 tv sub(&tv stop, &tv start); 

LS, clockus = tv_stop.tv_sec * 1000000.0 + tv_stop.tv_usec; 
16 return (clockus) ; 

ay? i} 

18 int 

19 touch(void *vptr, int nbytes) 
20 { 
21 char *cptr; 
22 static int  pagesize - 0; 
23 if (pagesize -- 0) ( 
24 errno - 0; 
25 #ifdef | SC PAGESIZE 
26 if ( (pagesize - sysconf( SC PAGESIZE)) -- -1) 
27 return(-1); 
28 #else 
29 pagesize - getpagesize(); /* BSD */ 
30 #endif 

31 ) 

32 cptr = vptr; 

33 while (nbytes > 0) ( 

34 *optr s 1; 

35 cptr += pagesize; 

36 nbytes -= pagesize; 

37 } 

38 return (0) ; 

39 } 


图 A-17 计时 函数 : start_time ^ stop timeflltouch 


lib/timing.c 


lib/timing.c 


AJA-1824 Hi f'tv subERZX; 它 在 两 个 timeval 结 构 间 做 减法 运算 ， 并 


把 结果 存 回 第 一 个 结构 中 。 


lib/tv sub.c 
1 #include "unpipc.h" 


2 void 

3 tv sub(struct timeval *out, struct timeval *in) 

41{ 

if ( (out-»tv usec -= in->tv usec) < 0) { /* out -= in */ 
--out-»tv sec; 
out-»tv usec += 1000000; 

) 


out-»tv sec -- in-»tv sec; 


[= mon A Ul 


} 


lib/tv_sub.c 


图 A-18 tv_sub 画 数 : 两 个 timeval 结 构 相 减 


在 运行 Solaris 2.6 的 一 台 Sparc 主 机 上 接连 运行 我 们 的 程序 5 次 ， 得 
到 如 下 结 

solaris 96 bw. pipe 5 10 65536 

bandwidth: 13.722 MB/sec 

solaris 96 bw. pipe 5 10 65536 

bandwidth: 13.781 MB/sec 

solaris 96 bw. pipe 5 10 65536 

bandwidth: 13.685 MB/sec 

solaris 96 bw. pipe 5 10 65536 

bandwidth: 13.665 MB/sec 

solaris 96 bw. pipe 5 10 65536 

bandwidth: 13.584 MB/sec 

每 次 我 们 指定 5 轮 循环 ， 每 轮 循环 传送 10 485 7607 ^-E D, ER 
write 和 read 调 用 收发 65536 个 字 节 “。 这 5 次 程序 运行 的 平均 值 为 图 A-2 中 
所 示 的 13.7MB/s。 

A.3.2 Posix 消 息 队 列 带 宽 程 序 

图 A-19 是 一 个 Posix 消 息 队 列 带宽 测量 程序 的 main 函 数 。 图 A-20 给 
出 了 其 中 的 writer 和 reader 函 数 。 该 程序 与 前 面 那个 管道 带宽 测量 程序 类 
似 。 


1 #include "unpipc.h" 
2 #define NAME "bw pxmsg" 


3 void reader (int, mgd t, int); 
4 void writer (int, mqd t); 


5 void *buf; 


6 int totalnbytes, xfersize; 

v: int 

8 main(int argc, char **argv) 

9 1 

10 int i, nloop, contpipe[2]; 
11 mqd t mq; 

12 pid t  childpid; 

13 struct mq attr attr; 

14 if (argc !- 4) 

15 err quit("usage: bw pxmsg <#loops> <#mbytes> <#bytes/write>") ; 
16 nloop - atoi(argv[1]); 


bench/bw pxmsg.c 


图 A-19 PosixiHi I AJ SEU E FE Amain ÉR ZR 


17 totalnbytes - atoi(argv[2]) * 1024 * 1024; 
18 xfersize = atoi (argv[3]); 

19 buf = Valloc(xfersize) ; 

20 Touch (buf, xfersize); 

21 Pipe (contpipe) ; 

22 mq unlink(Px ipc name(NAME)); /* error OK */ 
23 attr.mq_maxmsg = 4; 

24 attr.mq_msgsize = xfersize; 

25 mq = Mq open(Px ipc name(NAME), O_RDWR | O CREAT, FILE MODE, &attr) ; 
26 if ( (childpid = Fork()) == 0) { 

27 writer (contpipe[0], mq); /* child */ 
28 exit (0); 

29 } 

30 /* parent */ 

31 Start time(); 

32 for (i = 0; i « nloop; i++) 

33 reader(contpipe[1], mq, totalnbytes); 

34 printf("bandwidth: $.3f MB/sec\n", 

35 totalnbytes / Stop time() * nloop); 
36 kill(childpid, SIGTERM); 

37 Mq close (mq) ; 

38 Mq unlink(Px ipc name (NAME) ) ; 

39 exit(0); 

40 ) 


图 A-19 (4) 


bench/bw pxmsg.c 


bench/bw pxmsg.c 


41 void 

42 writer (int contfd, mqd_t mqsend) 

43 

44 int ntowrite; 

45 for 63 43 1 

46 Read(contfd, &ntowrite, sizeof (ntowrite)); 
47 while (ntowrite » O) ( 

48 Mq send(mgsend, buf, xfersize, 0); 
49 ntowrite -- xfersize; 

50 ) 

51 ) 

52 } 

53 void 

54 reader (int contfd, mgd t mgrecv, int nbytes) 
55 ( 

56 ssize t n; 

57 Write(contfd, &nbytes, sizeof (nbytes)); 

58 while ((nbytes » 0) && 

59 ( (n = Mq receive(mgrecv, buf, xfersize, NULL)) > 0)) ( 
60 nbytes -- n; 

61 } 

62 } 


bench/bw pxmsg.c 


Fd A-20 测量 一 个 Posix 消 息 队 列 的 带宽 的 wirter 和 reader 函 数 

注意 ， 在 我 们 创建 消息 队列 时 ， 必 须 指 定 该 程序 上 能 存在 的 最 大 
消息 数 ， 我 们 把 它 指 定 为 4。IPC 通 道 的 容量 能 够 影响 性 能 ， 因 为 写 进 
TERA 2E FSET mqsend val H Z Ai BENS Az X125 Ze B3 As. PAIR AK 
将 上 下 文 切 换 到 读 进 程 。 因 此 本 程序 的 性 能 依赖 于 这 个 魔 数 。Solaris 
2.6 下 把 该 数 从 4 改 为 8 并 不 影响 图 A-2 中 的 各 个 数值 ， 然 而 Digital Unix 
4.0B 下 的 同样 变动 却 使 性 能 下 降 了 129%。 我 们 原本 会 猜想 消息 数 较 多 时 
性 能 将 增长 ， 因 为 这 可 以 让 上 下 文 切 换 数 降 低 一 半 。 然 而 如 果 用 到 了 
内 存 映 射 文件 ， 那 么 这 样 一 来 将 使 该 文件 的 大 小 增加 一 倍 ， 所 映射 的 
内 存 区 大 小 也 增长 一 倍 。 

A.3.3 System V 消 息 队 列 带 宽 程 序 

图 A-21 是 一 个 System V 消 息 队 列 带宽 测量 程序 的 main 范 数 ， 图 A- 
22 给 出 了 其 中 的 writer 和 reader 函 数 。 


1 sinc 


2 void 
3 void 


4 stru 
5 int 
6 int 
7 main 
8 ( 


lude "unpipc.h" 
reader(int, int, int); 
writer(int, int); 

ct msgbuf *buf; 


totalnbytes, xfersize; 


(int argc, char **argv) 


int i, nloop, contpipe[2], msqid; 
pid t  childpid; 


if (argc != 4) 
err quit ("usage: bw svmsg <#loops> <#mbytes> <#bytes/write>") ; 
nloop = atoi (argv[1]); 
totalnbytes - atoi(argv[2]) * 1024 * 1024; 
xfersize = atoi(argv[3]); 


buf = Valloc(xfersize) ; 
Touch(buf, xfersize); 
buf-»mtype - 1; 


Pipe (contpipe); 
msqid = Msgget(IPC PRIVATE, IPC CREAT | SVMSG MODE); 


if ( (childpid = Fork()) == 0) { 
writer(contpipe[0], msqid); /* child */ 
exit(0); 
) 
Start time(); 
for (i = 0; i « nloop; i++) 
reader(contpipe[1], msgid, totalnbytes); 
printf ("bandwidth: $.3f MB/sec\n", 
totalnbytes / Stop time() * nloop); 


kill(childpid, SIGTERM); 
Msgctl(msqid, IPC RMID, NULL); 
exit (0); 


图 A-21 — System V 消 息 队 列 带宽 测量 程序 的 main 函 数 


bench/bw svmsg.c 


bench/bw svmsg.c 


bench/bw svmsg.c 


34 void 

35 writer(int contfd, int msqid) 

36 ( 

37 int ntowrite; 

38 for (;;) { 

39 Read(contfd, &ntowrite, sizeof (ntowrite)); 
40 while (ntowrite > 0) { 

41 Msgsnd(msqid, buf, xfersize - sizeof(long), 0); 
42 ntowrite -= xfersize; 

43 } 

44 } 

45 } 

46 void 

47 reader(int contfd, int msqid, int nbytes) 

48 { 

49 ssize tn; 

50 Write(contfd, &nbytes, sizeof (nbytes)); 

51 while ((nbytes > 0) && 

52 ( (n = Msgrcv(msqid, buf, xfersize - sizeof (long), 0, 0)) > 0)) ( 
53 nbytes -= n + sizeof (long); 

54 ) 

55 ) 


bench/bw svmsg.c 


图 A-22 测量 一 个 System V 消 息 队 列 的 带宽 的 writer 和 reader 函 数 


A.3.4 门 带宽 程序 

门 API 带 宽 测 量程 序 比 本 节 中 先前 给 出 的 程序 要 复杂 ， 因 为 在 创建 
其 中 的 门 之 前 必须 fork 出 子 进程 。 父 进程 接着 创建 该 门 ， 并 通过 写 一 个 
管道 来 通知 子 进程 该 [能 被 打开 。 

不 像 图 A-14 的 另 一 个 变化 是 ，reader 函 数 不 接收 数据 。 相 反 ， 数 据 
是 由 名 为 server 的 函数 接收 鸭 ， 它 是 对 应 门 的 服务 硕 过 程 。 图 A-23 给 出 
了 该 程序 的 概貌 。 

门 只 在 Solaris 下 受 文 持 ， 于 是 我 们 通过 假设 采用 全 双 工 管道 (44 
TP) 来 简化 程序 本 身 。 

与 先前 的 程序 相 比 ， 男 一 个 变化 在 于 消息 传递 和 过 程 调用 间 的 基 
本 差异 。 例 如 在 我 们 的 Posix 消 息 队 列 程序 中 ， 写 入 者 只 是 在 一 个 循环 
中 往 一 个 队列 写 入 消 轧 ， 这 种 写 操 作 走 异步 的 。 到 某 个 时 刻 队列 满 


了 ， 或 者 写 进 程 形 失 了 目 己 的 处 理 圳 时 间 片 ， 读 出 者 焉 开始 运行 ， 读 
出 这 些 消 息 。 举 例 来 说 ， 如 有 果 该 队列 可 容纳 8 个 消息 ， 而 且 写 入 者 每 次 
运行 时 写 入 8 个 消息 ， 读 出 者 每 次 运行 时 读 出 所 有 8 个 消息 ， 那 么 发 送 N 
个 消息 将 涉及 N/4 次 上 下 文 切 换 (其 中 N/8 次 是 从 写 入 者 到 读 出 者 ， 男 
外 N/8 次 是 从 读 出 者 到 写 入 者 ) 。 然 而 门 API 是 同步 的 ; 调用 者 每 次 调 
Fidoor call]BH 2€, HERRA Six Pel A BEP, o KANNI EE 
vy NX2UX E FOCUS o W fSRRPCUSBIBJTE RE, KA TANE [8] ERE f] 
题 。 尽 管 上 下 文 切换 数 增加 了 ， 从 图 A-3 可 以 看 出 ， 当 消息 大 小 在 约 
25000 字 节 或 以 上 时 ， 门 却 提供 了 最 快 的 了 PC 带宽 。 

图 A-24 给 出 了 该 程序 的 main 函 数 。writer 、server 和 reader 函 数 则 在 
图 A-25 中 给 出 。 


main() 


{ 


Pipe (contpipe) ; 
证 (BorkO) ==] 0) eee: if (Fork() == 0) { 
Read(contpipr[0], ); 
doorfa = Open(); 
writer(); 


exit(0); 


} 
doorfd = Door create(); 
Fattach(); 

Write(contpipe[1], ); 


reader(); 


exit( 0); 


writer() 


{ 


server() 


{ 


Read(contpipe[0], ); 
while (more to send); 
Write(datapipe[1], ); 
Door call(); 


门 服务 


if (end of data) 
write(contpipe[0], ); 


Door return(); 


) 


reader() 

{ 
Write(contpipe[1], ); 
Read(contpipe[1], ); 


给 本 函 
数 计时 


} 


图 A-23 | JAPITE Si il EF BRA 


bench/bw door.c 


1 #include "unpipc.h" 
2 void reader(int, int); 
3 void writer (int); 
4 void server(void *, char *, size t, door desc t *, size t); 
5 void *buf; 
6 int totalnbytes, xfersize, contpipe[2]; 
7 int 
8 main(int argc, char **argv) 
9 { 
10 int i, nloop, doorfd; 
Ts. char e 
12 pid t childpid; 
13 ssize t n; 
14 if (argc != 5) 
15 err quit("usage: bw door «pathname» <#loops> <#mbytes> <#bytes/write>") ; 
16 nloop = atoi(argv[2]) ; 
17 totalnbytes - atoi(argv[3]) * 1024 * 1024; 
18 xfersize = atoi(argv[4]); 
19 buf = Valloc (xfersize); 
20 Touch(buf, xfersize); 
图 A-24 | J APIT? 2530] ETEF main Zt 
21 unlink (argv[1]); 
22 Close(Open(argv[1], O CREAT | O EXCL | O RDWR, FILE MODE)); 
23 Pipe (contpipe); /* assumes full-duplex SVR4 pipe */ 
24 if ( (childpid = Fork()) == 0) { 
25 /* child = client = writer */ 
26 if ( (n = Read(contpipe[0], &c, 1)) != 1) 
27 err quit("child: pipe read returned %d", n); 
28 doorfd - Open(argv[1], O RDWR); 
29 writer (doorfd); 
30 exit (0); 
31 ) 
32 /* parent - server - reader */ 
33 doorfd - Door create(server, NULL, 0); 
34 Fattach(doorfd, argv[11); 
35 Write(contpipe[1], &c, 1); /* tell child door is ready */ 
36 Start time(); 
37 for (i = 0; i « nloop; i++) 
38 reader (doorfd, totalnbytes); 
39 printf("bandwidth: $.3f MB/sec\n", 
40 totalnbytes / Stop time() * nloop); 
41 kill(childpid, SIGTERM); 
42 unlink (argv[1]); 
43 exit(0); 
44 ) 


bench/bw door.c 


on 


图 A-24 (EE) 


bench/bw door.c 


45 void 
46 writer(int doorfd) 
47 ( 
48 int ntowrite; 
49 door arg t arg; 
50 arg.desc ptr - NULL; /* no descriptors to pass */ 
51. arg.desc_num = 0; 
52 arg.rbuf = NULL; /* no return values expected */ 
53 arg.rsize = 0; 
54 tor (2 9) 4 
55 Read(contpipe[0], &ntowrite, sizeof (ntowrite)); 
56 while (ntowrite > 0) ( 
57 arg.data ptr - buf; 
58 arg.data size - xfersize; 
59 Door call(doorfd, &arg); 
60 ntowrite -- xfersize; 
61 ) 
62 ) 
63 } 
64 static int ntoread, nread; 
65 void 
66 server(void *cookie, char *argp, size t arg size, 
67 door desc t *dp, size t n descriptors) 
68 ( 
图 A-25 测量 门 API 的 带宽 的 writer、server 和 reader 函 数 
69 char c 
70 nread += arg size; 
7I if (nread >= ntoread) 
72 Write(contpipe[0], &c, 1); /* tell reader() we are all done */ 
73 Door return(NULL, 0, NULL, 0); 
74 } 
75 void 
76 reader(int doorfd, int nbytes) 
77 4 
78 char Qu 
79 ssize tn; 
80 ntoread - nbytes; /* globals for server() procedure */ 
81 nread - 0; 
82 Write(contpipe[1], &nbytes, sizeof (nbytes)); 
83 if ( (n = Read(contpipe[1], &c, 1)) != 1) 
84 err quit("reader: pipe read returned %d", n); 
85 } 


图 A-25 (AE) 


bench/bw door.c 


A.3.5 Sun RPC 带 宽 程 序 

既然 Sun RPC 中 的 过 程 调用 是 同步 的 ， 那 么 我 们 有 已 随 前 面 的 门 程 
序 提 到 过 的 同样 限制 。 使 用 RPC 时 生成 一 个 客户 和 一 个 服务 器 两 个 程 
序 更 为 容易 ， 因 为 它们 是 由 rpcgen 生 成 的 。 图 A-26 给 出 了 本 程序 的 RPC 
说 明 书 文件 。 我 们 声明 了 单个 过 程 ， 它 以 一 个 可 变 长 度 不 透明 数据 作 
为 输入 ， 不 返回 任何 东西 。 


bench/bw sunrpc.x 
1 %#define DEBUG /* so server runs in foreground */ 


2 struct data in { 


3 opaque data<>; /* variable-length opaque data */ 
4 } A 

5 program BW_SUNRPC_PROG { 

6 version BW SUNRPC VERS { 

7 void BW SUNRPC(data in) - 1; 

8 } = 1; 

9 ) = 0x31230001; 


bench/bw sunrpc.x 


图 A-26 Sun RPC 带 宽 测量 程序 的 RPC 说 明 书 文件 

图 A-27 给 出 了 我 们 的 客户 程序 ， 图 A-28 给 出 了 我 们 的 服务 器 过 
程 。 我 们 把 协议 (TCP 或 UDP) 指定 为 客户 程序 的 一 个 命令 行 参数 ， 以 
允许 分 别 测量 这 两 种 协议 。 


bench/bw sunrpc client.c 
1 #include "unpipc.h" 
2 #include "pw sunrpc.h" 


3 void *buf; 
4 int totalnbytes, xfersize; 


5 int 


图 A-27 测量 Sun RPC 的 带宽 的 RPC 客 户 程序 


6 main(int argc, char **argv) 


7í( 

8 int i, nloop, ntowrite; 

9 CLIENT *cl; 

10 data in in; 

TI if (argc != 6) 

12 err quit("usage: bw sunrpc client «hostname» <#loops>" 
13 " <#mbytes> <#bytes/write> «protocol»"); 
14 nloop = atoi(argv[2]); 

15 totalnbytes - atoi(argv[3]) * 1024 * 1024; 

16 xfersize = atoi(argv[4]); 

19 buf = Valloc(xfersize) ; 

18 Touch (buf, xfersize) ; 

19 cl = Clnt_create(argv[1], BW_SUNRPC_PROG, BW_SUNRPC_VERS, argv[5]); 
20 Start time(); 
21 for (i = 0; i « nloop; i++) { 
22 ntowrite = totalnbytes; 
23 while (ntowrite > 0) ( 
24 in.data.data len - xfersize; 
25 in.data.data val - buf; 
26 if (bw sunrpc 1(&in, cl) == NULL) 
27 err quit("$s", clnt sperror(cl, argv[1])); 
28 ntowrite -- xfersize; 
29 } 
30 } 
31 printf ("bandwidth: $.3f MB/sec\n", 
32 totalnbytes / Stop time () * nloop); 
33 exit(0); 
34 } 

bench/bw sunrpc client.c 
图 A-27 (5E) 
bench/bw sunrpc server.c 
1 #include "unpipc.h" 
2 #include "bw sunrpc.h" 


3 #ifndef RPCGEN ANSIC 
4 #define bw sunrpc 1 svc bw sunrpc 1 
5 #endif 


6 void * 

7 bw sunrpc 1 svc(data in *inp, struct svc req *rqstp) 
8 { 

9 static int nbytes; 


10 nbytes - inp-»data.data len; 
11 return(&nbytes); /* must be nonnull, but xdr void() will ignore */ 
12 } 


FE 


图 A-28 测量 Sun RPC 的 带宽 的 RPC 服 务 器 过 程 


A.4 消息 传递 延迟 程序 


bench/bw sunrpc server.c 


本 市 给 出 测量 管道 、Posix 消 息 队 列 、System Vil ABS > [']fllsun 
RPC 的 延迟 的 各 个 程序 。 图 A-1 给 出 了 它们 的 性 能 值 。 

A.4.1 管道 延迟 程序 

图 A-29 给 出 了 测量 一 个 管道 的 延迟 的 程序 。 


bench/lat pipe.c 

1 #include "unpipc.h" 

2 void 

3 doit(int readfd, int writefd) 

& 4 

5 char es 

6 Write (writefd, &c, 1); 

p if (Read(readfd, &c, 1) != 1) 

8 err quit("read error"); 

9 

10 int 

11 main(int argc, char **argv) 

12 f 

13 int i, nloop, pipel[2], pipe2[2]; 

14 char c; 

15 pid t childpid; 

16 if (arge != 2) 

17 err quit("usage: lat pipe <#loops>") ; 

18 nloop - atoi(argv[1]); 

19 Pipe (pipel); 
20 Pipe (pipe2) ; 
21 if ( (childpid = Fork()) == 0) { 
22 for (| 3.29 /* child */ 
23 if (Read(pipel[0], &c, 1) != 1) 
24 err quit("read error"); 
25 Write(pipe2[1], &c, 1); 
26 ) 
27 exit(0); 
28 ) 
29 /* parent */ 

30 doit (Pipe2 [0], pipel[1]); 

31 Start time(); 
32 for (i = 0; i « nloop; i++) 

33 doit (Pipe2 [0] pipel[1]); 

34 printf("latency: $.3f usec\n", Stop time() / nloop); 
35 Kill(childpid, SIGTERM); 

36 exit(0); 

37 } 

bench/lat pipe.c 
图 A-29 测量 一 个 管道 的 延迟 的 程序 


doit Ex 2X 


2~9 本 函数 在 父 进程 中 运行 ， 它 所 花 的 时 钟 时 间 将 被 测量 出 来 。 
它 往 一 个 管道 写 入 1 个 字 节 (该 字 节 将 由 子 进程 读 出 ) 后 从 另 一 个 管道 
EMIS CREATAS ERS A) 。 这 就 是 我 们 所 描述 的 延迟 ， 从 
发 送 一 个 小 消 居 到 接收 作为 应 答 的 一 个 小 消 恩 所 伦 的 时 间 。 

创建 管道 

19~ 20 创建 两 个 管道 ，fork 一 个 子 进程 ， 形 成 图 4-6 所 示 的 布局 

(不 过 没有 关闭 每 个 管道 的 未 用 端 ， 这 是 不 会 有 问题 的 ) 。 本 测试 程 

序 确 实 需要 两 个 管道 ， 因 为 管道 是 半 双 工 的 ， 而 我 们 希望 父子 进程 间 
有 双 回 通信 。 

子 进程 回 射 只 有 1 个 字 节 的 消息 

22-27 子 进程 执行 一 个 无 限 循环 ， 每 次 读 出 一 个 只 有 1 个 字 节 的 消 
A Jer e A A Bo ° 

测量 父 进程 

29~ 34 父 进 程 百 移 调 用 doit 给 子 进 程 发 送 一 个 只 有 1 个 字 蔬 的 消 
居 ， 并 读 出 它 的 也 是 只 有 1 个 字 市 的 应 答 。 这 使 得 两 个 进程 都 处 于 运行 
状态 。 父 进程 然后 在 一 个 循环 中 调用 doit 函 数 ， 同 时 测量 所 人 花 的 时 钟 时 
|R] ° 

在 运行 Solaris 2.6 的 一 台 Sparc 主 机 上 接连 运行 该 程序 5 次 ， 得 到 如 


solaris 96 lat pipe 10000 
latency: 278.633 usec 
solaris 96 lat pipe 10000 
latency: 397.810 usec 
solaris 96 lat pipe 10000 
latency: 392.567 usec 
solaris 96 lat pipe 10000 
latency: 266.572 usec 


solaris 96 lat pipe 10000 

latency: 284.559 usec 

这 5 次 程序 运行 的 平均 值 为 324 微 秒 ， 它 就 是 图 A-1 中 给 出 的 值 。 这 
些 时 间 包括 两 次 上 下 文 切换 (从 父 进程 到 子 进程 ， 然 后 是 从 子 进程 到 
父 进程 ) 、 四 个 系统 调用 ( 父 进 程 的 write、 子 进程 的 read、 子 进程 的 
write、 父 进程 的 read) 以 及 每 个 方向 1 字 市 数据 的 管道 开销 。 

A.4.2 Posix 消 息 队 列 延 迟 程 序 

图 A-30 给 出 了 一 个 Posix 消 息 队 列 延 迟 测 量程 序 。 


bench/lat pxmsg.c 
1 #include "unpipc.h" 
2 #define NAME1 "lat pxmsgl" 
3 #define NAME2 "lat pxmsg2" 
4 #define MAXMSG 4 /* room for 4096 bytes on queue */ 
5 #define MSGSIZE 1024 


6 void 
7 doit (mqd_t mqsend, mqd_t mqrecv) 


8 { 


9 char buff [MSGSIZE] ; 
10 Mq_send(mqsend, buff, 1, 0); 
11 if (Mq receive(mqrecv, buff, MSGSIZE, NULL) !- 1) 
12 err quit("mq receive error"); 
13 } 
14 int 
15 main(int argc, char **argv) 
16 
2:7 int i, nloop; 
18 mgd t mqi, mq2; 
19 char buff [MSGSIZE]; 


图 A-30 一 个 Posix 消 息 队 列 延 迟 测量 程序 


20 pid t childpid; 


21 struct mq attr attr; 

22 if (argc !- 2) 

23 err quit("usage: lat pxmsg <#loops>") ; 

24 nloop = atoi(argv[1]); 

25 attr.mq maxmsg - MAXMSG; 

26 attr.mq msgsize - MSGSIZE; 

27 mql = Mq open(Px ipc name(NAME1), O RDWR | O CREAT, FILE MODE, &attr); 
28 mq2 - Mq open(Px ipc name(NAME2), O RDWR | O CREAT, FILE MODE, &attr); 
29 if ( (childpid = Fork()) == 0) { 

30 for m.) /* child */ 

31 if (Mq receive(mgi, buff, MSGSIZE, NULL) !- 1) 
32 err quit("mq receive error"); 

33 Mq send(mg2, buff, 1, 0); 

34 ) 

35 exit (0); 

36 ) 

37 /* parent */ 

38 doit (mgl, mq2) ; 

39 Start time(); 

40 for (i = 0; i < nloop; i++) 

41 doit (mgl, mq2) ; 

42 printf ("latency: $.3f usec\n", Stop time() / nloop); 
43 Kill(childpid, SIGTERM); 

44 Mq close (mq1); 

45 Mq close (mq2) ; 

46 Mq unlink(Px ipc name (NAME1) ) ; 

47 Mq unlink(Px ipc name (NAME2)); 

48 exit (0); 

49 } 


bench/lat pxmsg.c 


图 A-30 (5E) 


25~28 创建 两 个 消息 队列 ， 一 个 用 于 从 父 进 程 到 子 进程 的 消息 传 
递 ， 另 一 个 用 于 从 子 进 程 到 父 进程 的 消息 传递 。 尽 管 Posix 消 息 具 有 优 
先 级 ， 从 而 允许 我 们 给 两 个 不 同方 向 的 消息 赋 不 同 的 优先 级 ， 
md_receive 却 总 是 返回 队列 中 的 下 一 个 消 妃 。 因 此 ， 我 们 不 能 仅 给 本 测 
试 程 序 使 用 一 个 队列 。 

A.4.3 System V 消 息 队 列 延 迟 程序 

图 A-31 给 出 了 一 个 System V 消 息 队 列 延 迟 测量 程序 。 

本 程序 只 创建 一 个 消息 队列 ， 它 含有 两 个 不 同方 向 的 消息 从 父 

进程 到 子 进程 和 从 子 进 程 


到 父 进程 。 前 者 的 类 型 字段 为 1， 后 者 的 类 型 字段 为 2。doit 中 
msgrcv 的 第 四 个 参数 为 2， 子 进程 中 msgrcv 的 第 四 个 参数 为 1， 它 们 都 
只 读 出 所 指定 类 型 的 消 已 。 

在 9.3 廊 和 11.3 市 中 我 们 提 到 过 ， 许 多 由 内 核定 义 的 结构 不 能 静态 
地 初始 化 ， 因 为 Posix.1 和 Unix 98 只 你 证 在 这 样 的 结构 中 存在 特定 的 成 
员 。 这 两 个 标准 不 保证 这 些 成 员 的 顺序 ， 更 何况 这 样 的 结构 还 可 以 含 
有 其 他 的 非 标准 成 员 。 然 而 在 本 程序 中 我 们 还 是 静态 地 初始 化 msgbuf 
结构 ， 因 为 System V 消 息 列 保证 该 结构 含有 一 个 long 类 型 的 消 忆 类 型 成 
员 ， 后 跟 真 正 的 数据 。 


bench/lat svmsg.c 


14 
15 
16 


#include "unpipc.h" 
struct msgbuf p2child = { 1, { 0 } 
struct msgbuf child2p = { 2, { 0 } 
struct msgbuf inbuf ; 


i [* type = X'*/ 
i [* type = 2 */ 


void 
doit(int msgid) 
{ 
Msgsnd(msgid, &p2child, 0, 0); 
if (Msgrcv(msgid, &inbuf, sizeof(inbuf.mtext), 2, 0) != 0) 
err quit("msgrcv error"); 


) 
int 
main(int argc, char **argv) 
( 
int i, nloop, msgid; 
pid t  childpid; 
if (argc !- 2) 
err quit("usage: lat svmsg <#loops>") ; 
nloop = atoi(argv[1]); 
msgid - Msgget(IPC PRIVATE, IPC CREAT | SVMSG MODE); 
if ( (childpid = Fork()) == 0) { 
fom (EJ /* child */ 
if (Msgrcv(msgid, &inbuf, sizeof(inbuf.mtext), 1, 0) != 0) 
err quit("msgrcv error"); 
Msgsnd(msgid, &child2p, 0, 0); 
) 
exit (0); 
) 
/* parent */ 
doit (msgid); 
Start time(); 
for (i = 0; i « nloop; i++) 
doit (msgid); 
printf("latency: %.3f usec\n", Stop time() / nloop); 
Kill(childpid, SIGTERM); 
Msgctl(msgid, IPC RMID, NULL); 
exit(0); 
) 


bench/lat svmsg.c 


图 A-31 一 个 System V 消 息 队 列 延 迟 测 量程 序 


A.4.4 门 延迟 程序 

图 A-32 给 出 了 门 API 的 延迟 测量 程序 。 子 进程 创建 其 中 的 门 ， 然 后 
给 该 门 关 联 以 server 画 数 。 父 进程 接着 打开 该 门 ， 并 在 一 个 循环 中 激活 
door_call。 作 为 参数 传递 的 是 1 个 字 节 的 数据 ， 返 回 值 则 不 存在 。 


1 #include "unpipc.h" 
2 void 
3 server(void *cookie, char *argp, size t arg size, 
4 door desc t *dp, size t n descriptors) 
5 { 
6 char ds 
7 Door return(&c, sizeof(char), NULL, 0); 
8] 
9 int 
10 main(int argc, char **argv) 
11.17 
12 int i, nloop, doorfd, contpipe[2]; 
13 char es 
14 pidt  childpid; 
15 door arg t arg; 
16 if (arge != 3) 
17 err quit("usage: lat door «pathname» <#loops>") ; 
18 nloop = atoi(argv[2]); 
19 unlink (argv [1]) ; 
20 Close (Open(argv[1], O CREAT | O EXCL | O_RDWR, FILE MODE)); 
21 Pipe (contpipe) ; 
22 if ( (childpid = Fork()) == 0) { 
23 doorfd = Door create(server, NULL, 0); 
24 Fattach(doorfd, argv[1]); 
25 Write(contpipe[1], &c, 1); 
26 for ( = = ) /* child - server */ 
27 pause() ; 
28 exit (0); 
29 ) 
30 arg.data ptr - &c; /* parent - client */ 
31 arg.data size = sizeof (char); 
32 arg.desc ptr - NULL; 
33 arg.desc num - 0; 
34 arg.rbuf - &c; 
35 arg.rsize = sizeof (char); 
36 if (Read(contpipe[0], &c, 1) != 1) /* wait for child to create */ 
37 err quit("pipe read error"); 
38 doorfd - Open(argv[1], O RDWR); 
39 Door call(doorfd, &arg); /* once to start everything */ 
40 Start time(); 
41 for (i = 0; i « nloop; i++) 
42 Door call(doorfd, &arg); 
43 printf("latency: $.3f usec\n", Stop time() / nloop); 
44 Kill(childpid, SIGTERM); 
45 unlink (argv [1]) ; 
46 exit (0); 
47 ) 


bench/lat door.c 


bench/lat door.c 


图 A-32 门 API 的 延迟 测量 程序 


A.4.5 Sun RPC 延 迟 程序 

为 测量 Sun RPC API 的 延迟 ， 我 们 编写 一 个 客户 和 一 个 服务 器 两 个 
程序 (类 似 于 测量 Sun RPC 带 宽 的 做 法 ) 。 我 们 使 用 同样 的 RPC 说 明 书 
文件 (图 A-26) ， 不 过 这 次 我 们 的 客户 程序 调用 空 过 程 。 回 想 习 题 
16.11， 我 们 知道 该 过 程 没有 参数 ， 也 没有 返回 值 ， 而 这 正好 是 测量 延 
迟 所 需 的 。 图 A-33 给 出 了 客户 程序 。 跟 习题 16.11 的 解答 一 样 ， 我 们 必 
须 通 过 直接 调用 clnt_call 来 调用 空 过 程 ， 在 客户 程序 存根 中 不 提供 它 的 
存根 函数 。 


bench/lat sunrpc. client.c 


1 #include "unpipc.h" 
2 #include "lat sunrpc.h" 


3 int 


4 main(int argc, char **argv) 


int i, nloop; 
CLIENT *cl; 
struct timeval tv; 


if (argc != 4) 
err quit("usage: lat sunrpc client «hostname» <#loops> <protocol>") ; 
nloop = atoi(argv[2]); 


cl = Clnt create(argv[1], BW SUNRPC PROG, BW SUNRPC VERS, argv[3]); 


tv.tv sec - 10; 
tv.tv usec - 0; 
Start time(); 
for (i = 0; i < nloop; i++) { 
if (clnt call(cl, NULLPROC, xdr void, NULL, 
xdr void, NULL, tv) !- RPC SUCCESS) 
err quit("$s", clnt sperror(cl, argv[11)); 
} 
printf("latency: $.3f usec\n", Stop time() / nloop); 
exit(0); 


bench/lat sunrpc client.c 


图 A-33 测量 Sun RPC 延 迟 的 Sun RPC 客 户 程 序 


我 们 使 用 图 A-28 中 的 服务 器 函 数 编译 出 服务 右 程 序 ， 不 过 该 函数 
从 来 不 被 调用 。 既 然 是 使 用 rpcgen 来 构造 客户 程序 和 服务 器 程序 的 ， 那 
么 我 们 需要 定义 至 少 一 个 服务 器 过 程 ， 但 是 可 不 调用 它 。 使 用 rpcgen 的 


原因 在 于 它 自 动产 生 融 空 过程 的 服务 器 程序 的 main 画 数 ， 而 我 们 正 需 

A.5 线程 同步 程序 

为 测量 各 种 同步 技术 所 需 的 上 时间， 我 们 创建 一 定数 目的 线程 (图 
A-6 和 图 A-8 给 出 的 测量 结果 使 用 1 个 到 5 个 线程 ) ， 每 个 线程 给 处 于 共 
享 内 存 区 中 的 一 个 计数 器 加 1 很 多 次 (一 个 很 大 的 次 数 ) ， 各 线程 使 用 
相应 于 当前 测量 的 同步 形式 来 协调 对 于 该 共享 计数 器 的 访问 。 

A.5.1 Posix 互 斥 锁 程 序 

图 A-34 给 出 了 Posix 互 乒 锁 测量 程序 的 全 局 变量 和 main 函 数 。 


bench/incr_pxmutex1.c 


1 #include "unpipc.h" 
2 #define MAXNTHREADS 100 
3 int nloop; 


4 struct { 

5  pthread mutex t mutex; 
6 long counter; 

7 ) shared = { 

8 PTHREAD MUTEX INITIALIZER 
9 


pi 


10 void xincr (void *); 

11. int 

12 main(int argc, char **argv) 

13 ( 

14 int i, nthreads; 

15 pthread t tid [MAXNTHREADS] ; 

16 if (arge != 3) 

17 err quit("usage: incr pxmutexl1 <#loops> <#threads>") ; 
18 nloop = atoi(argv[1]); 

19 nthreads = min(atoi(argv[2]), MAXNTHREADS) ; 

20 /* lock the mutex */ 

21 Pthread_mutex_lock (&shared.mutex) ; 

22 /* create all the threads */ 

23 Set_concurrency (nthreads) ; 

24 for (i = 0; i < nthreads; i++) { 

25 Pthread create(&tid[i], NULL, incr, NULL); 

26 } 

27 /* start the timer and unlock the mutex */ 

28 Start time(); 

29 Pthread mutex unlock (&shared.mutex) ; 

30 /* wait for all the threads */ 

31 for (i = 0; i < nthreads; i++) { 

32 Pthread join(tid[i], NULL); 

33 ) 

34 printf("microseconds: $.0f usec\n", Stop time()); 
35 if (shared.counter !- nloop * nthreads) 

36 printf("error: counter = %ld\n", shared.counter); 
37 exit(0); 

38 ) 


bench/incr_pxmutex1.c 


图 A-34 测量 Posix 互 斥 锁 同 步 的 全 局 变量 和 main 函 数 


共享 的 数据 
4~9 各 线程 间 共 至 的 数据 由 互 不 锁 本 身 和 计数 器 构成 。 该 互 不 锁 
征 静 态 初始 化 的 。 


给 互 斥 锁 上 锁 并 创建 线程 

20~26 主线 程 在 创建 其 他 线程 前 给 共享 数据 的 互 斥 锁 上 锁 ， 这 样 
在 所 有 线程 都 创建 出 来 并 且 主 线程 释放 该 互 不 锁 之 前 ， 没 有 一 个 线程 
能 够 获取 该 互 不 锁 。 主 线程 接着 调用 我 们 的 set_concurrency 范 数 ， 并 创 
建 出 各 个 线程 。 每 个 线程 执行 接 下 来 给 出 的 incr 函 数 。 

启动 定时 器 并 释放 互 不 锁 

27--36 一 旦 所 有 线程 都 已 创建 ， 主 线程 就 启动 定时 器 并 释放 互 不 
锁 。 它 接 下 去 等 得 所 有 线程 结束 ， 到 时 候 就 停止 是 时 器 ， 输 出 所 计 的 
总 微 秒 数 。 

图 A-35 给 出 了 每 个 线程 执行 的 pcr 函 数 。 


bench/incr_pxmutex1.c 


39 void * 
40 incr(void *arg) 
41 { 
42 int i; 
43 for (i = 0; i < nloop; i++) { 
44 Pthread_mutex_lock (&shared.mutex) ; 
45 shared. counter++; 
46 Pthread_mutex_unlock (&shared.mutex) ; 
47 
48 return (NULL) ; 
49 } 
bench/incr pxmutex l.c 
图 A-35 使 用 一 个 Posix 互 斥 锁 给 一 个 共享 的 计数 器 加 1 
在 临界 区 中 给 计数 器 加 1 
44--46 获取 共享 数据 的 互 斥 锁 后 给 共享 的 计数 器 加 1。 接 着 释放 该 
互 不 锁 。 
A.5.2 读 写 锁 程序 


使 用 读 写 锁 的 程序 由 刚才 使 用 Posix 互 不 锁 的 程序 稍 加 修改 而 成 。 
每 个 线程 在 给 共享 的 计数 器 加 1 前 必须 获取 该 计数 器 读 写 锁 中 的 写 入 
DE 

实现 第 8 章 中 讲述 的 Posix 读 写 锁 的 系统 并 不 多 ，Posix 读 写 锁 是 
Unix 98 的 一 部 分 内 容 ， Posix.1j 工 作 组 目前 正在 考虑 它 的 标准 化 。 本 附 


录 中 给 出 的 读 写 锁 测量 结果 是 在 Solaris 2.6 下 做 出 的 ， 它 使 用 在 
rwlock(3T) 手 册页 面 中 描述 的 Solaris 读 写 锁 。 该 实现 提供 了 与 提议 中 的 
读 写 锁 同 样 的 功能 ， 以 我 们 在 第 8 章 中 给 出 的 函数 为 接口 来 使 用 这 些 画 
数 所 需要 的 包 囊 函数 非常 简单 。 

Digital Unix 4.0B 下 的 测量 结果 是 使 用 Digital 的 线程 无 关 服 务 读 写 
锁 做 出 的 ， 这 种 读 写 锁 在 tis_rwlock 手 册页 面 中 描述 。 我 们 不 再 给 出 为 
这 些 读 写 锁 对 图 A-36 和 图 A-37 进 行 的 简单 修改 。 

[A-3625 41 f mainENZX, A-3725 H1 T incrER 2 o 


bench/incr. rwlockl.c 
1 #include "unpipc.h" 
2 #include <synch.h> /* Solaris header */ 


3 void Rw wrlock(rwlock t *rwptr) ; 
4 void Rw unlock(rwlock t *rwptr); 


5 #define MAXNTHREADS 100 


6 int nloop; 

7 struct ( 

8 rwlock t rwlock; /* the Solaris datatype */ 

9 long counter; 

10 ) shared; /* init to 0 -» USYNC THREAD */ 


图 A-36 读 写 锁 同 步 测 量程 序 的 main 函 数 


11 void *incr(void *); 


12 int 

13 main(int argc, char **argv) 

14 ( 

15 int i, nthreads; 

16 pthread t | tid [MAXNTHREADS] ; 

17 if (argo b= 3) 

18 err quit("usage: incr rwlockl <#loops> <#threads>") ; 

19 nloop = atoi (argv[1]); 

20 nthreads = min(atoi(argv[2]), MAXNTHREADS) ; 

2 /* obtain write lock */ 

22 Rw wrlock(&shared.rwlock); 

23 /* create all the threads */ 

24 Set concurrency (nthreads); 

25 for (i = 0; i < nthreads; i++) { 

26 Pthread create(&tid[i], NULL, incr, NULL); 

27 ) 

28 /* start the timer and release the write lock */ 

29 Start time(); 

30 Rw unlock(&shared.rwlock); 

31 /* wait for all the threads */ 

32 for (i = 0; i < nthreads; i++) { 

33 Pthread join(tid[i], NULL); 

34 } 

35 printf ("microseconds: $.0f usec\n", Stop time() ; 

36 if (shared.counter != nloop * nthreads) 

3 printf("error: counter = %ld\n", shared.counter); 

38 exit (0); 

39 } 
bench/iner_rwlock1.c 

图 A-36 (28) 

bench/incr_rwlock1.c 

40 void * 

41 incr (void *arg) 

42 ( 

43 int i; 

44 for (i = 0; i < nloop; i++) { 

45 Rw_wrlock (&shared.rwlock) ; 

46 shared. counter++; 

47 Rw_unlock (&shared.rwlock) ; 

48 } 

49 return (NULL) ; 

50 } 


bench/incr rwlockl.c 


图 A-37 使 用 一 个 读 写 锁 给 一 个 共享 的 计数 器 加 1 


A.5.3 Posix 基 于 内 存 的 信号 量程 序 


我 们 既 测 量 Posix 基 于 内 存 的 信号 量 ， 也 测量 Posix 有 名 信号 量 。 图 
A-39 给 出 了 基于 内 存 的 信号 量 的 测量 程序 的 main 函 数 ， 图 A-38 给 出 了 
它 的 incr 函 数 。 


bench/incr pxseml.c 


37 void * 
38 incr(void *arg) 


39 ( 

40 int i; 

41 for (i = 0; i « nloop; i++) { 
42 Sem_wait (&shared.mutex) ; 
43 shared.counter++; 

44 Sem_post (&shared.mutex) ; 
45 } 

46 return (NULL) ; 

47 } 


bench/incr pxseml.c 


个 共享 的 计数 器 加 1 


AS 
Š 


图 A-38 使 用 一 个 Posix 基 于 内 存 的 信和 号 量 


bench/incr_pxsem1.c 


1 #include "unpipc.h" 

2 #define MAXNTHREADS 100 

3 int nloop; 

4 struct ( 

5 sem t mutex; /* the memory-based semaphore */ 
6 long counter; 

7 } shared; 

8 void *incr(void *); 

9 int 

10 main(int argc, char **argv) 
13 of 
12 int i, nthreads; 
13 pthread t tid [MAXNTHREADS] ; 
14 if (arge: ls 3) 
15 err quit("usage: incr pxseml <#loops> <#threads>") ; 
16 nloop = atoi (argv[11); 

17 nthreads - min(atoi(argv[2]), MAXNTHREADS); 
18 /* initialize memory-based semaphore to 0 */ 

19 Sem init(&shared.mutex, 0, 0); 

20 /* create all the threads */ 

21 Set concurrency (nthreads) ; 

22 for (i = 0; i « nthreads; i++) { 

23 Pthread create(&tid[i], NULL, incr, NULL); 

24 } 

25 /* start the timer and release the semaphore */ 
26 Start time(); 

27 Sem post (&shared.mutex) ; 
28 /* wait for all the threads */ 

29 for (i = 0; i « nthreads; i++) { 

30 Pthread join(tid[i], NULL); 

31 ) 

32 printf("microseconds: $.0f usec\n", Stop time()); 
33 if (shared.counter !- nloop * nthreads) 

34 printf("error: counter = %ld\n", shared.counter) ; 
35 exit (0); 

36 } 


bench/incr_pxsem1.c 


图 A-39 Posix& T AEE S5 ER [8] 27 5) Se FF HP] main ER 2 

18--19 创建 一 个 值 为 0 的 信号 量 ， 而 把 给 sem_init 的 第 二 个 参数 指 
定 为 0 表明 所 创建 的 信号 量 将 在 调用 进程 的 各 个 线程 间 共 享 。 

20~27 创建 出 所 有 的 线程 后 ， 主 线程 启动 定时 器 并 调用 sem_post 
一 次 

A.5.4 Posix 有 名 信号 量程 序 


图 A-41 给 出 了 Posix 有 名 信号 量 测量 程序 的 main 函 数 ， 图 A-40 给 出 
了 它 的 ipcr 函 数 。 


bench/incr pxsem2.c 


40 void * 
41 incr(void *arg) 
42 ( 
43 int 35 
44 for (i = 0; i < nloop; i++) { 
45 Sem_wait (shared.mutex) ; 
46 shared. counter++; 
47 Sem_post (shared.mutex) ; 
48 } 
49 return (NULL) ; 
50 } 
bench/incr pxsem2.c 
图 A-40 Posix 有 名 信和 号 量 的 同步 的 测量 程序 的 main 函 数 
bench/incr_pxsem2.c 
1 #include "unpipc.h" 
2 #define MAXNTHREADS 100 
3 #define NAME "incr pxsem2" 
4 int nloop; 
5 struct { 
6 sem t *mutex; /* pointer to the named semaphore */ 
7 long counter; 
8 ) shared; 
9 void *incr(void *); 
10 int 
11 main(int argc, char **argv) 
12 { 
13 int i, nthreads; 
14 pthread t tid[MAXNTHREADS] ; 
15 if (argc I=. 3) 
16 err quit("usage: incr pxsem2 <#loops> <#threads>") ; 
17 nloop = atoi(argv[1]); 
18 nthreads = min(atoi(argv[2]), MAXNTHREADS) ; 
19 /* initialize named semaphore to 0 */ 
20 sem unlink(Px ipc name (NAME) ) ; /* error OK */ 
21 Shared.mutex = Sem open(Px ipc name(NAME), O CREAT | O EXCL, FILE MODE,0); 
22 /* create all the threads */ 
23 Set concurrency (nthreads) ; 
24 for (i = 0; i < nthreads; i++) { 
25 Pthread create(&tid[i], NULL, incr, NULL); 
26 ) 
27 /* start the timer and release the semaphore */ 


图 A-41 使 用 一 个 Posix 有 名 信号 量 给 一 个 共享 的 计数 器 加 1 


28 
29 


30 
Jd 
32 
33 
34 
35 
36 
37 


38 
39 } 


Start time(); 
Sem post (shared.mutex) ; 


/* wait for all the threads */ 
for (i = 0; i < nthreads; i++) { 
Pthread_join(tid[i], NULL) ; 


} 
printf ("microseconds: $.0f usec\n", Stop time()); 
if (shared.counter != nloop * nthreads) 


printf ("error: counter = %ld\n", shared.counter) ; 
Sem_unlink (Px_ipc_name (NAME) ) ; 


exit (0); 


图 A-41 (E) 


A.5.5 System V 信 和 号 量程 序 
图 A-42 给 出 了 System V 信 号 量 测 量程 序 的 main 函 数 ， 图 A-43 给 出 
它 的 incr 函 数 。 


bench/incr pxsem2.c 


bench/incr. svseml.c 
#include "unpipc.h" 


#define MAXNTHREADS 100 
int nloop; 


struct ( 
int semid; 
long counter; 
) shared; 


struct sembuf postop, waitop; 
void *incr(void *); 


int 

main(int argc, char **argv) 

{ 
int i, nthreads; 
pthread t tid [MAXNTHREADS] ; 
union semun arg; 


if (argc != 3) 

err quit("usage: incr svseml <#loops> <#threads>") ; 
nloop = atoi(argv[1]); 
nthreads - min(atoi(argv[2]), MAXNTHREADS); 


/* create semaphore and initialize to 0 */ 
Shared.semid - Semget(IPC PRIVATE, 1, IPC CREAT | SVSEM MODE) ; 
arg.val - 0; 
Semctl(shared.semid, 0, SETVAL, arg); 
postop.sem num - 0; /* and init the two semop() structures */ 
postop.sem op = 1; 
postop.sem flg = 0; 
waitop.sem num - 0; 
waitop.sem op = -1; 
waitop.sem flg = 0; 


图 A-42 测量 System V fai EB [8] > HU EE main ER Zt 


30 /* create all the threads */ 


31 Set concurrency (nthreads); 
32 for (i = 0; i « nthreads; i++) ( 
33 Pthread create(&tid[i], NULL, incr, NULL); 
34 } 
35 /* start the timer and release the semaphore */ 
36 Start time(); 
37 Semop(shared.semid, &postop, 1); /* up by 1 */ 
38 /* wait for all the threads */ 
39 for (i = 0; i < nthreads; i++) ( 
40 Pthread join(tid[i], NULL); 
41 } 
42 printf ("microseconds: $.0f usec\n", Stop time()); 
43 if (shared.counter != nloop * nthreads) 
44 printf ("error: counter = %ld\n", shared.counter) ; 
45 Semctl(shared.semid, 0, IPC RMID); 
46 exit (0); 
47 ) 
bench/incr svseml.c 
图 A-42 (5) 
bench/incr svseml.c 
48 void * 
49 incr(void *arg) 
50 { 
51 int i; 
52 for (i = 0; i < nloop; i++) { 
53 Semop(shared.semid, &waitop, 1); 
54 shared.counter-4-; 
55 Semop(shared.semid, &postop, 1); 
56 ) 
57 return (NULL); 
58 ) 


bench/incr. svseml.c 


图 A-43 使 用 一 个 System V 信 和 号 量 给 一 个 共享 的 计数 器 加 1 


20-23 创建 一 个 仅 有 一 个 成 员 的 信和 号 量 集 ， 并 把 它 的 值 初始 化 为 


IH 


0 o 

24~29 Ue HPT semopee I. 一 个 用 于 挂 出 该 信号 量 ， 另 一 个 用 

等 待 该 信号 量 。 注 意 这 两 个 结构 的 sem_flg 成 员 均 为 0， 也 就 是 说 没有 
指定 SEM_UNDO 标 志 。 

A.5.6 带 SEM_UNDO 特 性 的 System V 信 号 量程 序 

测量 具有 SEM_UNDO 特 性 的 System V 信 号 量 的 程序 与 图 A-42 相 比 
的 唯一 差别 是 : 它 把 两 个 semop 结 构 的 sem_flg 成 员 设 置 成 SEM_UNDO 


而 不 是 0。 我 们 不 再 给 出 这 个 简单 修改 后 的 版 本 。 

A.5.7 fcnti 记 录 上 锁 程序 

最 后 一 个 程序 使 用 fcntl 记 录 上 锁 提供 同步 。 图 A-45 给 出 了 它 的 
main 函 数 。 该 程序 只 在 指定 单个 线程 时 才 会 成 功 地 运行 ， 因 为 fcnd 锁 是 
在 不 同 进 程 间 而 不 是 单个 进程 的 不 同 线程 间 共 享 的 。 当 指定 多 个 线程 
时 ， 每 个 线程 总 能 获取 所 请 求 的 锁 (也 就 是 说 writew_lock 调 用 从 不 阻 
塞 ， 因 为 调用 进程 早已 拥有 该 锁 ) ， 因 而 计数 器 的 最 终 值 是 错误 的 。 

18~22 待 创建 并 随后 用 于 上 锁 的 文件 的 路 径 名 是 作为 一 个 命令 行 
参数 指定 的 。 这 样 允 许 我 们 就 驻 留 在 不 同文 件 系 统 上 的 文件 测量 这 个 
程序 。 我 们 预期 当 该 文件 处 在 某 个 通过 NFS 安 装 的 文件 系统 上 时 ， 该 程 
序 的 运行 变 慢 ， 这 种 情况 要 求 两 个 系统 (NFS 客 户主 机 和 NFS 服 务 器 主 
NL) 都 支持 NFS 记 录 上 锁 。 

图 A-44 给 出 了 使 用 记录 上 锁 的 incr 函 数 。 


bench/incr_fentll.c 


44 void * 

45 incr(void *arg) 

46 { 

47 int i; 

48 for (i = 0; i < nloop; i++) { 

49 Writew lock(shared.fd, 0, SEEK SET, 0); 
50 shared.counter++; 

51 Un lock(shared.fd, 0, SEEK SET, 0); 
52 } 

53 return (NULL) ; 

54 } 


bench/incr fcntll.c 


图 A-44 使 用 fcntl 记 录 上 锁 给 一 个 共享 的 计数 器 加 1 


4 #include "unpipc.h" 


5 #define MAXNTHREADS 100 


bench/incr fcntll.c 


6 int nloop; 

7 struct ( 

8 int fd; 

9 long counter; 

10 ) shared; 

11 void *incr(void *); 

32: TAC 

13 main(int argc, char **argv) 

14 ( 

15 int i, nthreads; 
16 char *pathname; 
ld pthread t tid [MAXNTHREADS] ; 
18 if (argc !- 4) 
19 err quit("usage: incr fcntll <pathname> <#loops> <#threads>") ; 
20 pathname = argv[1]; 
21 nloop = atoi(argv[2]) ; 
22 nthreads = min(atoi(argv[3]), MAXNTHREADS) ; 
23 /* create the file and obtain write lock */ 
24 shared.fd = Open (pathname, O_RDWR | O CREAT | O TRUNC, FILE MODE); 
25 Writew lock(shared.fd, 0, SEEK SET, 0); 
26 /* create all the threads */ 
27 Set concurrency (nthreads) ; 
28 for (i = 0; i « nthreads; i++) { 
29 Pthread create(&tid[i], NULL, incr, NULL); 
30 } 
31 /* start the timer and release the write lock */ 
32 Start time(); 

图 A-45 fcntl 记 录 上 锁 测量 程序 的 main 范 数 

33 Un lock(shared.fd, 0, SEEK SET, 0); 

34 /* wait for all the threads */ 

35 for (i = 0; i « nthreads; i++) { 

36 Pthread_join(tid[i], NULL) ; 

37 } 

38 printf ("microseconds: $.0f usec\n", Stop time()); 

39 if (shared.counter != nloop * nthreads) 

40 printf ("error: counter = %ld\n", shared.counter) ; 
41 Unlink (pathname) ; 

42 exit (0) ; 

43 } 


on 


图 A-45 (A) 


A.6 进程 同步 程序 


bench/incr_fentll.c 


上 一 市 给 出 的 程序 中 ， 多 个 线程 间 共 享 一 个 计数 器 比较 简单 :我 
们 只 需 把 该 计数 器 作为 一 个 全 局 变量 存放 。 我 们 现在 修改 这 些 程序 以 
提供 不 同 进 程 间 的 同步 。 

为 在 一 个 父 进程 和 它 的 各 个 子 进程 间 共 享 该 计数 器 ， 我 们 把 它 存 
放 在 由 图 A-46 给 出 的 my_shm 画 数 分 配 的 共享 内 存 区 中 。 


lib/my_shm.c 
1 #include "unpipc.h" 
2 void * 
3 my shm(size t nbytes) 
4 { 
5 void *shared; 
6 dif defined (MAP ANON) 
7 shared - mmap(NULL, nbytes, PROT READ | PROT WRITE, 
8 MAP ANON | MAP SHARED, -1, 0); 
9 #elif | defined(HAVE DEV ZERO) 
10 int fd; 
11 /* memory map /dev/zero */ 
12 if ( (fd = open("/dev/zero", O RDWR)) == -1) 
13 return(MAP FAILED); 
14 shared - mmap(NULL, nbytes, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
15 close (fd); 
16 # else 
17 4 error cannot determine what type of anonymous shared memory to use 
18 # endif 
19 return (shared) ; /* MAP FAILED on error */ 
20 ) 
lib/my shm.c 


图 A-46 给 一 个 父 进程 和 它 的 各 个 子 进程 创建 一 个 共享 内 存 区 


如 果 系 统 支持 MAP_ANON 标 志 (402.45) ， 我 们 就 使 用 它 ， 否 则 
我 们 把 /dev/zero (12.5 节 ) 映射 到 内 存 。 

进一步 的 修改 依赖 于 同步 类 型 以 及 调用 fork 时 底层 文 撑 数 据 类 型 发 
生 的 变化 。 我 们 已 在 10.12 节 讲述 过 其 中 一 些 细节 。 

Posix 互 不 锁 : 互 斥 锁 必 须 存 放 在 共享 内 存 区 中 〈 跟 共享 的 计数 器 
在 一 起 ) , my H uw) $8 (5 m m RMN o5 s Xx g 
PTHREAD_PROCESS_SHARED 必 性。 我 们 稍 后 给 出 这 个 程序 的 代 
码 。 


Posix 读 写 锁 : 读 写 锁 必 须 存放 在 共享 内 存 区 中 〈 跟 共享 的 计数 器 
在 一 起 ) ， 而 且 初 始 化 读 写 锁 时 必须 设置 
PTHREAD_PROCESS_SHARED 属 性 。 

Posix 基 于 内 存 的 信号 量 : 信号 量 必须 存放 在 共享 内 存 区 中 〈 跟 共 
享 的 计数 器 在 一 起 ) ， 而 且 sem _init 的 第 二 个 参数 必须 为 1， 从 而 指定 
该 信号 量 是 在 进程 间 共 享 的 。 

we 我 们 既 可 以 证 父 进程 和 每 个 子 进程 都 调用 
sem_open， 也 可 以 只 让 父 进程 调用 sem_open， 因 为 我 们 知道 该 信号 量 
将 通过 fork 由 子 进 

System Vin E: 不 必 编 写 任 何 特殊 的 代码 ， 因 为 这 种 信号 量 总 
是 能 够 在 进程 间 共 享 。 子 进程 只 需 知道 父 进程 所 创建 信号 量 的 标识 
f? 


fcnt 记 录 上 锁 : 不 必 编 写 任 何 特殊 的 代码 ， 因 为 描述 符 可 通过 fork 
由 子 进 程 共享 o 

我 们 只 给 出 Posix 互 不 锁 程 序 的 代码 。 

Posix E JF Bf 

Posix 互 斥 锁 程 序 的 main 函 数 使 用 一 个 Posix 互 乒 锁 来 提供 进程 间 的 
同步 形式 ， 如 图 A-48 所 示 。 图 A-47 给 出 了 它 的 incr 范 数 。 


bench/incr. pxmutex5.c 
46 void * 

47 incr(void *arg) 

48 ( 


49 int is 

50 for (i = 0; i « nloop; i++) { 

51 Pthread_mutex_lock (&shared->mutex) ; 
52 shared->counter++; 

53 Pthread_mutex_unlock (&shared->mutex) ; 
54 } 

55 return (NULL) ; 


56 } 


bench/incr_pxmutex5.c 


图 A-47 测量 进程 间 Posix 互 斥 锁 上 锁 的 incr 函 数 


bench/incr_pxmutex5.c 
1 #include "unpipc.h" 


2 #define MAXNPROC 100 


3 int nloop; 

4 struct shared ( 

5  pthread mutex 七 mutex; 

6 long counter; 

7 ) *shared; /* pointer; actual structure in shared memory */ 
8 void *incr(void *); 

9 int 

10 main(int argc, char **argv) 

11 ( 

ale} int i, nprocs; 

13 pid t childpid[MAXNPROC] ; 
14 pthread mutexattr t mattr; 


图 A-48 进程 间 Posix 互 斥 锁 上 锁 测 量程 序 的 main 函 数 


15 if (arge != 3) 

16 err quit("usage: incr pxmutex5 <#loops> <#processes>") ; 
17 nloop - atoi(argv[1]); 

18 nprocs = min(atoi(argv[2]), MAXNPROC) ; 

19 /* get shared memory for parent and children */ 

20 shared = My shm(sizeof (struct shared)); 

21 /* initialize the mutex and lock it */ 

22 Pthread mutexattr init(&mattr); 

23 Pthread mutexattr setpshared(&mattr, PTHREAD PROCESS SHARED); 
24 Pthread mutex init(&shared-»mutex, &mattr); 

25 Pthread mutexattr destroy (&mattr) ; 

26 Pthread mutex lock (&shared->mutex) ; 

27 /* create all the children */ 

28 for (i = 0; i < nprocs; i++) { 

29 if ( (childpid[i] = Fork()) == 0) ( 

30 incr (NULL) ; 

31 exit (0); 

32 } 

33 } 

34 /* parent: start the timer and unlock the mutex */ 
35 Start time(); 

36 Pthread mutex unlock (&shared->mutex) ; 

37 /* wait for all the children */ 

38 for (i = 0; i < nprocs; i++) { 

39 Waitpid(childpid[i], NULL, 0); 

40 } 

41 printf ("microseconds: $.0f usec\n", Stop time()) ; 

42 if (shared->counter != nloop * nprocs) 

43 printf ("error: counter = %ld\n", shared->counter) ; 
44 exit (0) ; 

45 } 


bench/incr_pxmutex5.c 


图 A-48 ( 续 ) 

19~20 既然 使 用 多 个 进程 〈 一 个 父 进程 的 多 个 子 进程 ) ， 我 们 就 
必须 把 shared 结 构 置 于 共享 内 存 区 中 。 我 们 调用 图 A-46 给 出 的 my_shm 
函数 做 到 这 一 点 。 

217-26 既然 互 斥 锁 处 于 共享 内 存 区 中 ， 我 们 束 不 能 静态 地 对 它 初 
台 化 ， 而 必须 在 设置 一 个 PTHREAD_PROCESS_SHARED 属 性 对 象 后 
调用 pthread_mutex_init 初 始 化 它 。 该 互 斥 锁 一 开始 是 锁 着 的 。 

27--36 创建 出 所 有 子 进程 后 ， 父 进程 启动 定时 器 ， 并 给 互 不 锁 解 
锁 。 

37--43 父 进程 等 待 所 有 子 进程 都 结束 ， 然 后 停止 定时 器 。 


[1], megabyte 一 词 存在 歧义 。 我 们 在 它 代表 220 字 节 时 译 为 M 字 节 ， 在 
它 代表 106 字 节 时 译 为 兆 字 节 。kilobyte 和 gigabyte 两 词 也 有 类 似 译 法 。 
E 


B 线程 入 | 


B.1 概述 

本 附录 六 总 基本 的 Posix 线 程 尔 数 。 在 传统 的 Unix 模 型 中 ， 当 一 个 
进程 需要 由 男 一 个 实体 来 执行 某 件 事 时 ， 它 就 fork 一 个 子 进程 ， 让 子 
进程 去 进行 处 理 。 举 例 来 说 ，Unix 下 的 大 多 数 网 络 服 务 絮 程序 束 是 这 
么 编写 的 。 

尽管 这 种 模式 已 成 功 地 使 用 了 很 多 年 ， 但 是 fork 仍 然 又 露出 了 以 
下 问题 。 

fork 的 开销 很 大 。 内 存 映像 要 从 父 进 程 复 制 到 子 进程 ， 所 有 描述 
符 要 在 子 进 程 中 复制 一 份 ， 等 等 。 当 前 的 系统 实现 使 用 一 种 称 为 写 时 
复制 (copy-on-write) 的 技术 ， 可 避免 父 进程 数据 空间 一 开始 就 同 子 
进程 复制 ， 直 到 子 进程 确实 需要 目 己 的 副本 为 止 。 尽 管 有 这 种 优化 技 
术 ，fork 的 开销 仍然 很 大 。 

fork 子 进程 后 ， 需 要 用 进程 间 通 信 (IPC) 在 父子 进程 之 间 传 递 信 
妃 。fork 之 前 由 父 进程 准备 好 的 信息 容易 传递 ， 因 为 子 进程 是 从 父 进 
程 的 数据 空间 及 所 有 描述 符 的 一 个 副本 开始 运行 的 。 但 是 从 子 进 程 返 
回信 息 给 父 进程 却 磊 费 周折 。 

线程 有 助 于 解决 这 两 个 问题 。 线 程 有 时 称 为 轻 权 进程 

(lightweight process) ， 因 为 线程 比 进程 < 权 轻 >”。 [1] 也 就 是 说 ， 创 建 

线程 可 能 比 创 建 进程 快 10~100 倍 。 

一 个 进程 内 的 所 有 线程 共 吾 同一 个 全 局 内 存 空间 。 这 使 得 线程 间 
很 容易 共享 信息 ， 但 是 这 种 容易 性 也 带 来 了 同步 (synchronization) [Fl 


题 。 一 个 进程 内 的 所 有 线程 不 光 共 至 全 局 变量 ， 以 下 信息 也 是 它们 所 
REW: 

进程 指令 ; 

大 多 数 数据 ; 

打开 的 文件 (例如 描述 符 ) ，; 

言 号 处 理 程序 和 信和 与 处 置 ; 


当前 工作 目录 ; 

用 户 ID 和 组 ID。 

但 是 下 列 信息 却 是 特定 于 每 个 线程 的 : 
线程 ID 


寄存 圳 集合 ， 包 括 程 序 计数 磺 和 栈 指针 
栈 (用 于 存放 局 部 变量 和 返回 地 址 ) : 
errno; 
Ho TED; 
优先 级 。 
B.2 基本 线程 函数 : 创建 和 终止 
本 万 讨论 5 个 基本 线程 函数 。 
B.2.1 pthread, create WH 
当 一 个 程序 由 exec 局 动 执 行 时 ， 系 统 将 创建 一 个 称 为 初始 线程 
(initial thread) 或 主线 程 (mainthread) 的 单个 线程 。 其 余 线程 则 由 
pthread_create 函 数 创建 。 
#include <pthread.h> 
int pthread_create(pthread_t *tid,const pthread_attr_t *attr, 
void *(*func)(void *),void *arg); 
返回 : ERDIKO, AEEA ENEE 
一 个 进程 内 的 各 个 线程 是 由 线程 ID (thread ID) 标识 的 ， 这 些 线 
程 的 数据 类 型 为 pthread_t。 如 采 新 的 线程 创建 成 功 ， 它 的 ID 融通 过 tid 


和 和 针 返 回 。 

每 个 线程 有 多 个 属性 (attribute) : 优先 级 、 初 始 栈 大 小 、 是 否 应 
该 是 一 个 守护 线程 ， 等 等 。 当 创建 线程 时 ， 我 们 可 通过 初始 化 一 个 
pthread_attr_t 变 量 来 指定 这 些 属性 以 履 盖 默认 值 。 我 们 通常 采用 默认 
值 ， 这 种 情况 下 ， 我 们 只 需 把 attr 参 数 指定 为 一 个 空 指针 。 

最 后 ， 当 创建 一 个 线程 时 ， 我 们 应 指定 一 个 它 将 执行 的 函数 ， 称 
VE MAES ENB (thread start function) 。 这 个 线程 以 调用 该 函数 
开始 ， 以 后 或 者 显 式 地 终止 (调用 pthread_exit) ， 或 者 隐 式 地 终止 

《让 该 函数 返回 ) 。 该 函数 的 地 址 作为 func 参 数 指定 ， 该 函数 唯一 的 
调用 参数 则 是 一 个 指针 arg。 如 采 需 要 给 该 函数 传递 多 个 参数 ， 我 们 束 
得 把 它们 打包 成 一 个 结构 ， 然 后 将 其 地 址 作为 这 个 唯一 的 参数 ， 传 递 
给 线程 启动 函数 。 

TEE func Al arg AY) E HH o func E Zi eat — “SI Fd RET SRL (void 
*) ， 返 回 一 个 通用 指针 (void *) 。 这 就 使 得 我 们 可 以 给 线程 传递 一 
个 指针 《指向 任何 我 们 想 要 指向 的 东西 ) ， 再 由 线程 返回 一 个 指针 

(同样 地 指向 任何 我 们 想 要 指向 的 东西 )。 

Pthread 函 数 的 返回 值 有 两 种 : 成 功 时 返回 0， 出 错时 返回 非 零 。 
与 出 错时 返回 -1， 并 置 errmo 为 菜 个 正 值 的 大 多 数 系 统 芳 数 不 同 ， 
Pthread 函 数 的 返回 值 是 正 值 的 出 错 指 示 。 人 例如， 如果 pthread_create 画 
数 因为 超过 了 系统 线程 数目 的 限制 而 不 能 创建 新 线程 ， 那 么 它 的 返回 
值 将 是 EAGAIN。Pthread 函 数 并 不 设置 errmo。 成 功 时 返回 9?， 出 错时 返 
回 非 零 的 约定 不 成 问题 ， 因 为 在 <sys/errmmo.h> 头 文件 中 的 所 有 Exxx 值 
都 大 于 0。0 值 永远 不 会 赋 给 任何 一 个 Exxx 常 值 。 

B.2.2 pthread_join Wal 

我 们 可 以 调用 pthread_join 等 竺 一 个 线程 终止 。 把 线程 和 Unix 进 程 
相 比 ， pthread_create 类 似 于 fork，pthread_join 则 类 似 于 waitpid ° 

#include <pthread.h> 


int pthread_join(pthread_t tid,void **status); 
返回 : 若 成 功 则 为 0， 若 出 错 则 为 正 的 Exxx 值 

我 们 必须 指定 要 等 待 的 线程 的 tid。 遗憾 的 是 ， 不 是 任意 一 个 线程 
的 终止 都 能 等 待 (类 似 于 给 waitpid 的 进程 ID 参 数 传递 -1 值 的 情况 ) 。 

如 果 status 指 针 非 空 ， 那 么 所 等 待 线程 的 返回 值 (指向 某 个 对 象 的 
指针 ) 将 存放 在 status 指 向 的 位 置 。 

B.2.3 pthread_self iK AX 

每 个 线程 都 有 在 某 个 给 定 的 进程 内 标识 自生 的 一 个 ID。 这 个 线程 
ID 由 pthread_create 函 数 返 回 ， 我 们 已 看 到 pthread_ join 函数 用 到 它 。 一 
个 线程 使 用 pthread_self 取 得 目 己 的 线程 ID。 

#include <pthread.h> 


pthread_t pthread_self(void); 
返回 : 调用 线程 的 线程 ID 
把 线程 和 Unix 进 程 相 比较 ，pthread_self 类 似 于 getpid 。 
也 .2.4 pthread_detach 函 数 
线程 或 者 是 可 汇合 的 (joinable) ， 或 者 是 脱离 的 (detached) 
当 可 汇合 的 线程 终止 时 ， 其 线程 ID 和 退出 状态 将 保留 ， 直 到 另外 一 个 
线程 调用 pthread join。 脱离 的 线程 则 像 守 护 进程 : 当 它 终止 时 ， 所 有 
的 资源 都 将 释放 ， 因 此 我 们 不 能 等 每 它 终止 。 如 果 一 个 线程 需要 知道 
男 一 个 线程 的 终止 时 间 ， 那 就 最 好 保留 第 二 个 线程 的 可 汇合 性 。 
pthread_detach 函 数 将 指定 的 线程 变 为 脱离 的 。 
#include <pthread.h> 
int pthread_detach(pthread_t tid); 
返回 : ERDIKO, AENA EEx E 
该 函数 通常 由 想 让 目 己 脱离 的 线程 使 用 ， 例 如 : 
pthread detach(pthread self()); 
B.2.5 pthread. exitEg Zi 


终止 一 个 线程 的 方法 之 一 是 调用 pthread_exit 。 

#include <pthread.h> 

void pthread exit(void *status); 

不 返回 到 调用 者 

如 果 该 线程 未 脱离 ， 那 么 其 线程 ID 和 退出 状态 将 一 直 保 留 到 调用 
进程 内 的 另外 某 个 线程 调用 pthread_join 为 止 。 

指针 status 不 能 指 回 局 部 于 调用 线程 的 对 象 MAE JS B ER 
数 中 的 某 个 目 动 变量 ) ， 因 为 该 线程 终止 时 那个 对 象 也 消失 了 。 

使 一 个 线程 终止 还 有 其 他 两 种 方法 。 

启动 该 线程 的 函数 (pthread_create 的 第 三 个 参数 ) 可 以 调用 
return。 有 既然 该 函数 必须 声明 成 返回 一 个 void 指针 ， 该 返回 值 便 是 该 线 
程 的 终止 状态 。 

如 果 本 进程 的 main 芳 数 返回 ， 或 者 某 个 线程 调用 了 exit 或 _exit， 那 
么 该 进程 将 立即 终 

止 ， 它 的 仍 在 运行 的 任意 线程 也 都 将 终止 。 


[1]. 线程 和 轻 权 进程 实际 上 是 不 同 的 概念 。Solaris 2.x 下 实际 存在 内 核 
线程 、 轻 权 进 程 和 用 户 线程 三 个 概念 。 一 一 译 者 注 


C.1 unpipc.h 头 文件 

本 书 正文 中 几乎 每 个 程序 都 包含 了 我 们 的 unpipc.h 头 文件 ， 它 如 图 
C-1 所 示 。 该 头 文件 包含 了 大 多 数 网 络 程序 需要 的 所 有 标准 系统 头 文件 
以 及 一 些 普通 的 系统 头 文件 。 它 还 定义 了 诸如 MAXLINE 等 常 值 和 我 们 
已 在 正文 中 定义 过 的 函数 〈 例 如 px_ipc_name) ， 以 及 所 用 到 的 所 有 包 
3 EK SLWI ANSI C 函 数 原 型 。 不 过 这 儿 没 有 给 出 这 些 原 型 。 


lib/unpipc.h 
/* Our own header. Tabs are set for 4 spaces, not 8 */ 


#ifndef . unpipc h 

#define . unpipc h 

#include "..f/eontig.h" /* configuration options for current OS */ 
/* "../config.h" is generated by configure */ 

/* If anything changes in the following list of #includes, must change 


../aclocal.m4 and ../configure.in also, for configure's tests. */ 
#include <sys/types.h> /* basic system data types */ 
#include <sys/time.h> /* timeval{} for select() */ 
#include <time.h> /* timespec{} for pselect() */ 
#include <errno.h> 
#include «fcntl.h» /* for nonblocking */ 

#include <limits.h> /* PIPE BUF */ 
#include «signal.h» 


#include <stdio.h> 

#include <stdlib.h> 

#include <string.h> 

#include <sys/stat.h> /* for S xxx file mode constants */ 
#include <unistd.h> 

#include «sys/wait.h» 


#ifdef HAVE MQUEUE H 


# include <mqueue.h> /* Posix message queues */ 
#endif 

#ifdef HAVE SEMAPHORE H 

# include <semaphore.h> /* Posix semaphores */ 


#ifndef SEM_FAILED 


#define SEM FAILED ((sem t *) (-1)) 
#endif 

#endif 

#ifdef HAVE SYS MMAN H 


图 C-1 我 们 的 unpipc.h 头 文件 


31 4 include <sys/mman.h> /* Posix shared memory */ 
32 #endif 


33 #ifndef MAP FAILED 
34 #define MAP FAILED ((void *) (-1)) 


35 #endif 

36 #ifdef HAVE SYS IPC H 

37 # include <sys/ipc.h> /* System V IPC */ 

38 #endif 

39 #ifdef HAVE SYS MSG H 

40 4 include <sys/msg.h> /* System V message queues */ 
41 #endif 


42 #ifdef HAVE SYS SEM H 
43 #ifdef _ bsdi - 


44 #undef HAVE SYS SEM H /* hack: BSDI's semctl() prototype is wrong */ 
45 #else 

46 4 include <sys/sem.h> /* System V semaphores */ 

47 #endif 

48 #ifndef HAVE SEMUN UNION 

49 union semun ( /* define union for semctl() */ 
50 int val; 

51 struct semid ds *buf; 

52 unsigned short  *array; 

53 }; 

54 #endif 


55 #endif /* HAVE SYS SEM H */ 


56 #ifdef HAVE SYS SHM H 


57 # include <sys/shm.h> /* System V shared memory */ 
58 #endif 

59 #ifdef HAVE SYS SELECT H 

60 4 include <sys/select.h> /* for convenience */ 
61 #endif 

62 #ifdef HAVE POLL H 

63 # include <poll.h> /* for convenience */ 
64 #endif 

65 #ifdef HAVE STROPTS H 

66 # include <stropts.h> /* for convenience */ 
67 #endif 

68 #ifdef HAVE STRINGS H 

69 # include <strings.h> /* for convenience */ 
70 #endif 


71 /* Next three headers are normally needed for socket/file ioctl's: 
72 * «sys/ioctl.h», «sys/filio.h», and <sys/sockio.h>. 

7a ay 

74 #ifdef HAVE SYS IOCTL H 

75 4 include <sys/ioctl.h> 

76 #endif 

77 #ifdef HAVE SYS FILIO H 

78 4 include <sys/filio.h> 

79 #endif 

80 #ifdef HAVE PTHREAD H 


) 


图 C-1 ( 


81 # include <pthread.h> 


82 #endif 

83 #ifdef HAVE DOOR H 

84 # include <door.h> /* Solaris doors API */ 

85 #endif 

86 #ifdef HAVE RPC RPC H 

87 #ifdef  PSX4 NSPACE H TS /* Digital Unix 4.0b hack, hack, hack */ 
88 #undef SUCCESS 

89 #endif 

90 # include <rpc/rpc.h> /* Sun RPC */ 

91 #endif 


92 /* Define bzero() as a macro if it's not in standard C library. */ 
93 #ifndef HAVE BZERO 

94 #define bzero(ptr,n) memset (ptr, 0, n) 

95 #endif 


96 /* Posix.lg requires that an #include of «poll.h» DefinE INFTIM, but many 
97 systems still DefinE it in «sys/stropts.h». We don't want to include 
98 all the streams stuff if it's not needed, so we just DefinE INFTIM here. 
99 This is the standard value, but there's no guarantee it is -1. */ 
100 #ifndef INFTIM 


101 #define INFTIM (-1) /* infinite poll timeout */ 

102 #ifdef HAVE POLL H 

103 #define INFTIM UNPH /* tell unpxti.h we defined it */ 
104 #endif 

105 #endif 

106 /* Miscellaneous constants */ 

107 #ifndef PATH MAX /* should be in <limits.h> */ 

108 #define PATH MAX 1024 /* max # of characters in a pathname */ 
109 #endif 

110 #define MAX PATH 1024 

111 #define MAXLINE 4096 /* max text line length */ 

112 #define BUFFSIZE 8192 /* buffer size for reads and writes */ 
113 #define FILE MODE (S IRUSR | S IWUSR | S IRGRP | S IROTH) 

114 /* default permissions for new files */ 

115 #define DIR MODE (FILE MODE | S IXUSR | S IXGRP | S IXOTH) 

116 /* default permissions for new directories */ 


117 #define SVMSG MODE (MSG R | MSG W | MSG R»»3 | MSG R>>6) 

118 /* default permissions for new SV message queues */ 
119 #define SVSEM MODE (SEM R | SEM A | SEM R>>3 | SEM R>>6) 

120 /* default permissions for new SV semaphores */ 

121 #define SVSHM MODE (SHM R | SHM W | SHM R>>3 | SHM R>>6) 

122 /* default permissions for new SV shared memory */ 


123 typedef void Sigfunc (int); /* for signal handlers */ 


124 #ifdef HAVE SIGINFO T STRUCT 
125 typedef void Sigfunc rt(int, siginfo t *, void *); 


126 #endif 
127 #define min(a,b) ((a) « (b) ? (a) : (b)) 
128 #define max(a,b) ((a) > (b) ? (a) : (b)) 


129 #ifndef HAVE TIMESPEC STRUCT 


图 C-1 ( 续 ) 
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struct timespec { 
time_t tv_sec; /* seconds */ 
long tv_nsec; /* and nanoseconds */ 

}; 

#endif 

/* 

* In our wrappers for open(), mq open(), and sem open() we handle the 

* optional arguments using the va XXX() macros. But one of the optional 
* arguments is of type "mode t" and this breaks under BSD/OS because it 
* uses a 16-bit integer for this datatype. But when our wrapper function 
* is called, the compiler expands the 16-bit short integer to a 32-bit 
* integer. This breaks our call to va arg(). All we can do is the 

* following hack. Other systems in addition to BSD/OS might have this 
* problem too ... 

*/ 

#ifdef — bsdi . 

#define va mode t int 

#else 

#define va mode t mode t 

#endif 

/* our record locking macros */ 
#define read lock(fd, offset, whence, len) \ 


lock reg(fd, F SETLK, F RDLCK, offset, whence, len) 
#define readw lock(fd, offset, whence, len) \ 

lock reg(fd, F SETLKW, F RDLCK, offset, whence, len) 
define write lock(fd, offset, whence, len) \ 

lock reg(fd, F SETLK, F WRLCK, offset, whence, len) 
#define writew lock(fd, offset, whence, len) \ 

lock reg(fd, F SETLKW, F WRLCK, offset, whence, len) 
#define un lock(fd, offset, whence, len) \ 

lock reg(fd, F SETLK, F UNLCK, offset, whence, len) 
#define is read lockable(fd, offset, whence, len) \ 

lock test(fd, F RDLCK, offset, whence, len) 
#define is write lockable(fd, offset, whence, len) \ 

lock test(fd, F WRLCK, offset, whence, len) 


lib/unpipc.h 


图 C-1 (2%) 


C.2 config.h 头 文件 


本 书 中 使 用 了 GN.autoconf 工 具 以 辅助 所 有 源 代码 的 移植 。 它 可 以 
从 ftp://prep.ai.mit.edu/pub/gnu 获 取 。 这 个 工具 生成 一 个 名 为 configure 的 
shell 脚 本 ， 在 把 软件 下 载 到 你 的 系统 后 你 必须 运行 该 脚本 。 这 个 脚本 
确定 你 的 Unix 系 统 所 提供 的 特性 : 文 持 SysteV 消 息 队 列 吗 ? 定义 
unit8_t 数 据 类 型 了 吗 ? fe He gethostname KAY PIS? 等 等 ， 最 终生 成 一 


个 名 为 config.h 的 头 文 件 。 它 是 上 市 介绍 的 unpipc.h 头 文件 中 包含 的 第 一 
个 头 文 件 。 图 C-2 给 出 了 在 使 用 gcc 编 译 器 的 前 提 下 ， 在 Solari.2.6 系 统 上 
生成 的 config.h 头 文件 。 

其 中 从 第 1 列 开始 以 #define 开 头 的 行 代表 系统 提供 了 的 特性 。 注 释 
挥 并 且 含 有 #andef 的 行 代表 系 统 没有 提供 的 特性 。 
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sparc-sun-solaris2.6/config.h 


/* config.h. Generated automatically by configure.  */ 
/* Define the following if you have the corresponding header */ 
#define CPU VENDOR OS "sparc-sun-solaris2.6" 

#define HAVE DOOR H 1 /* «door.h» */ 
#define HAVE MQUEUE H 1 /* «mqueue.h» */ 
#define HAVE POLL H 1 /* «poll.h» */ 
#define HAVE PTHREAD H 1 /* «pthread.h» */ 
#define HAVE RPC RPC H 1 /* «rpc/rpc.h» */ 
#define HAVE SEMAPHORE H 1 /* «semaphore.h» */ 
#define HAVE STRINGS H 1 /* «strings.h» */ 
#define HAVE SYS FILIO H 1 /* «sys/filio.h» */ 
#define HAVE SYS IOCTL H 1 /* «sys/ioctl.h» */ 
Hdefine HAVE SYS IPCH 1 /* «sys/ipc.h» */ 
#define HAVE SYS MMAN H 1 /* «sys/mman.h» */ 
#define HAVE SYS MSG H 1 /* «sys/msg.h» */ 
#define HAVE SYS SEM H 1 /* «sys/sem.h» */ 
#define HAVE SYS SHM H 1 /* «sys/shm.h» */ 
#define HAVE SYS SELECT H 1 /* «sys/select.h» */ 
/* #undef HAVE SYS SYSCTL H */ /* «sys/sysctl.h» */ 
#define HAVE SYS TIME H 1 /* «sys/time.h» */ 


/* Define if we can include «time.h» with «sys/time.h» */ 


#define TIME WITH SYS TIME 1 


/* Define the following if the function is provided */ 


#define HAVE BZERO 1 
#define HAVE FATTACH 1 
#define HAVE POLL 1 

/* #undef HAVE PSELECT */ 
#define HAVE SIGWAIT 1 
Hdefine HAVE VALLOC 1 
#define HAVE VSNPRINTF 1 


/* Define the following if the function prototype is in a header */ 


#define HAVE GETHOSTNAME PROTO 1 /* 
#define HAVE GETRUSAGE PROTO 1 /* 
/* #undef HAVE PSELECT PROTO */  /* 
#tdefine HAVE SHM OPEN PROTO 1 /* 


#define HAVE SNPRINTF PROTO 1 /* 


#define HAVE THR SETCONCURRENCY PROTO 1 


«unistd.h» */ 
«sys/resource.h» */ 
«sys/select.h» */ 
«sys/mman.h» */ 
«stdio.h» */ 

/* «thread.h» */ 


/* Define the following if the structure is defined. */ 


#define HAVE SIGINFO T STRUCT 1 
#define HAVE TIMESPEC STRUCT 1 
/* #undef HAVE SEMUN UNION */ 


/* Devices */ 


/* 
/* 
/* 


«signal.h» */ 
«time.h» */ 
«sys/sem.h» */ 


#define HAVE DEV ZERO 1 

/* Define the following to the appropriate datatype, if necessary */ 
/* #undef ints t */ /* «sys/types.h» */ 
/* #undef | int16 t */ /* «sys/types.h» */ 
/* #undef int32 t */ /* <sys/types.h> */ 
/* #undef ^ uint8 t */ /* «sys/types.h» */ 
/* &undef | uintl16 t */ /* «sys/types.h» */ 
/* &undef ^ uint32 t */ /* «sys/types.h» */ 
/* #undef size t */ /* <sys/types.h> */ 
/* &undef ssize t */ /* «sys/types.h» */ 
#define POSIX IPC PREFIX "/" 


#define RPCGEN ANSIC 1 


/* defined if rpcgen groks -C option */ 


sparc-sun-solaris2.6/config.h 


图 C-2 Solaris 2.6 上 的 config.h 头 文件 
C.3 标准 错误 处 理 函 数 
我 们 定义 了 一 组 自己 的 错误 处 理 钞 数 ， 它 们 用 在 整 本 书 中 以 处 理 
出 钳 情 况 。 定 义 一 组 目 己 的 销 误 处 理 函 数 的 原因 在 于 ， 我 们 可 以 用 一 
行 简单 的 C 代 码 编写 错误 处 理 过 程 ， 怠 像 如 下 所 示 : 
if (HERI) 
err_sys( 带 任意 数目 的 参数 的 printf 格 式 串 ); 
而 不 是 如 下 所 示 用 多 行 : 
if (HH TRA TP) 
char buff[200]; 
snprintf(buff,sizeof(buff), 带 任意 数目 的 参数 的 printf 格 式 串 ); 
perror(buff); 
exit(1); 
} 
我 们 的 错误 处 理 画 数 使 用 来 自 ANSI C 的 可 变 长 度 参数 表 机 制 。 具 
体 细节 参见 [Kernighan and Ritchie 1988] 的 7.3 节 。 
图 C-3 列 出 了 各 个 错误 处 理 函 数 之 间 的 差异 。 如 果 全 局 整数 
daemon_proc 非 零 ， 那 么 当前 出 错 消 忆 将 按 指定 的 级 别传 递 给 syslog 
(关于 syslog 的 细节 参见 UNPvl 第 12 章 ) ; 否则 ， 当 前 出 错 消息 输出 到 
标准 错误 输出 。 


err dump abort () LOG ERR 


err msg return; LOG INFO 


err quit exit (1) LOG ERR 


ero rer return; LOG INFO 


err Sys ; exit (1) LOG ERR 


图 C-3 标准 错误 处 理 函 数 汇 总 
图 C-4 给 出 了 图 C-3 所 示 的 5 个 函数 。 


lib/error.c 


1 #include "unpipc.h" 

2 #include «stdarg.h» /* ANSI C header file */ 

3 #include «syslog.h» /* for syslog() */ 

4 int daemon proc; /* set nonzero by daemon init() */ 


5 static void err doit(int, int, const char *, va list); 


6 /* Nonfatal error related to a system call. 
7 * Print a message and return. */ 


8 void 
9 err ret(const char *fmt, ...) 
10 ( 
71. va list ap; 
T2 va start(ap, fmt); 
13 err doit(1, LOG INFO, fmt, ap); 
14 va end(ap); 
15 return; 


图 C-4 我 们 的 标准 错误 处 理 函 数 
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) 


/* Fatal error related to a system call. 


* Print a message and terminate. */ 
void 
err sys(const char *fmt, ...) 
{ 
va list ap; 
va start(ap, fmt); 
err doit(1, LOG ERR, fmt, ap); 
va end(ap); 
exit (1); 
) 


/* Fatal error related to a system call. 


* Print a message, dump core, and terminate. */ 
void 
err dump(const char *fmt, ...) 
{ 
va list ap; 
va start(ap, fmt); 
err doit(1, LOG ERR, fmt, ap); 
va end(ap); 
abort (); /* dump core and terminate */ 
exit (1); /* shouldn't get here */ 
) 
/* Nonfatal error unrelated to a system call. 


* Print a message and return. */ 
void 
err msg(const char *fmt, ...) 
{ 
va list ap; 
va start(ap, fmt); 
err doit(0, LOG INFO, fmt, ap); 
va end(ap); 
return; 
) 
/* Fatal error unrelated to a system call. 


* Print a message and terminate. */ 
void 
err quit(const char *fmt, ...) 


{ 


va_list ap; 
va start(ap, fmt); 
err doit(0, LOG ERR, fmt, ap); 
va end(ap); 
exit (1); 
) 


/* Print a message and return to caller. 


* Caller specifies "errnoflag" and "level". */ 


图 C-4 ( 续 ) 


64 static void 
65 err doit(int errnoflag, int level, const char *fmt, va list ap) 


66 ( 

67 int errno save, n; 

68 char buf [MAXLINE] ; 

69 errno_save = errno; /* value caller might want printed */ 

70 #ifdef HAVE VSNPRINTF 

71 vsnprintf (buf, sizeof (buf), fmt, ap); /* this is safe */ 
72 #else 

73 vsprintf (buf, fmt, ap); /* this is not safe */ 
74 #endif 

75 n = strlen(buf); 

76 if (errnoflag) 

77 snprintf (buf+n, sizeof(buf)-n, ": $s", strerror (errno save)); 
78 strcat (buf, "\n"); 

79 if (daemon proc) { 

80 syslog(level, buf); 

81 ) eise { 

82 fflush(stdout); /* in case stdout and stderr are the same */ 
83 fputs(buf, stderr); 

84 fflush(stderr); 

85 } 

86 return; 

87 } 


图 C-4 ( 


X 


) 


lib/error.c 
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1.1 这 两 个 进程 只 需 给 open 函 数 指定 O_APPEND 标 志 ， 或 者 给 fopen 
函数 指定 谎 加 模式 。 内 核 保 证 每 次 write 都 将 新 的 数据 添加 到 该 文件 的 
末尾 。 这 是 可 指定 的 最 容易 的 文件 同步 形式 (APUES860—-6171 [1] 对 
此 有 具体 的 讨论 ) 。 当 更 新 文件 中 已 有 的 数据 时 ， 同 步 问 题 会 变 得 复 
杂 起 来 ， 数 据 库 系 统 中 的 情况 就 是 这 样 。 

1.2 典型 的 定义 类 似 如 下 : 

#ifdef REENTRANT 


#define errno (*_errno()) 


#else 

extern int errno; 

#endif 

如 果 _REENTRANT 已 定义 ， 引 用 errno 时 就 调用 一 个 名 为 _errno 的 
函数 ， 该 函数 返回 调用 线程 的 errno 变 量 的 地 址 。 该 变量 可 能 是 作为 线 
程 特定 数据 (UNPv1 的 23.5 节 [2] ) 存储 的 。 如 果 _REENTRANT 未 定 
义 ，ermo 束 是 一 个 全 局 int 变 量 。 

第 2 章 

2.1 这 两 位 能 改变 待 运行 程序 的 有 效用 户 ID 和 /或 有 效 组 ID。2.4 市 
中 用 到 了 这 两 个 有 效 ID。 

2.2 首先 同时 指定 O_CREAT 和 O_EXCL 标 志 ， 如 果 成 功 返 回 ， 那 么 
已 创建 了 一 个 新 对 象 。 然 而 如 果 调 用 失败 并 返回 EEXIST 错 误 ， 那 么 对 


象 已 经 存在 ， 程 序 于 是 得 再 次 调用 打开 函数 ， 不 过 不 再 同时 指定 
O_CREAT 和 O_EXCL 标 志 。 和 第 二 次 调用 应 该 成 功 ， 但 是 调用 失败 并 返 
回 ENOENT 错 误 的 机 会 仍然 存在 (尽管 很 小 ) ， 它 表明 在 这 两 次 调用 
之 间 ， 另 外 某 个 线程 或 进程 已 将 该 对 象 删除 了 。 

第 3 章 

3.1 我 们 的 程序 如 图 D-1 所 示 。 

3.2 第 二 个 程序 运行 时 ， 第 一 次 调用 msgget 使 用 的 是 第 一 个 可 用 的 
消息 队列 ， 其 槽 位 使 用 序列 号 在 运行 图 3-7 中 的 程序 两 次 之 后 变 为 20， 
因 而 返回 的 标识 符 值 为 1000。 假 设 下 一 个 可 用 的 消息 队列 从 未 使 用 

过 ， 其 柳 位 使 用 序列 号 于 是 为 0， 因 而 返回 的 标识 符 值 为 1 。 

3.3 我 们 的 简单 程序 如 图 D-2 所 示 。 


svmsg/slotseq.c 
1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 


4 1 


5 int i, msqid; 
6 struct msqid ds info; 
7 for (i = 0; i < 10; i++) { 
8 msqid - Msgget(IPC PRIVATE, SVMSG MODE | IPC CREAT); 
9 Msgctl(msqid, IPC STAT, &info); 
10 printf("msqid = $d, seq = %lu\n", msqid, info.msg perm.seq); 
11 Msgctl(msqid, IPC RMID, NULL); 
12 ) 
13 exit (0); 
14 } 


svmsg/slotseq.c 


图 D-1 $A Hi TRU Br PE A eS 


svmsg/testumask.c 


1 include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 ( 

5 Msgget(IPC PRIVATE, 0666 | IPC CREAT | IPC EXCL); 
6 unlink("/tmp/fifo.1"); 

7 Mkfifo("/tmp/fifo.1", 0666); 

8 exit(0); 

9 } 


svmsg/testumask.c 


图 D-2 测试 msgget 是 否 使 用 文件 模式 创建 掩 码 
从 下 面 的 程序 运行 情况 可 以 看 出 ， 文 件 模 式 创 建 掩 码 是 2 (RE 
他 用 户 写 位 ) ， 该 位 在 FIFO 中 确实 关 掉 ， 在 消息 队列 中 却 并 未 关 掉 。 
solaris 96 umask 
02 


solaris 96 testumask 


solaris % ls -l /tmp/fifo.1 

prw-rw-r--  1rstevens other1 0 Mar 25 16:05 /tmp/fifo.1 
solaris 96 ipcs -q 

IPC status from «running system» as of Wed Mar 25 16:06:03 1998 


T ID KEY MODE OWNER 
GROUP 

Message Queues: 

q 200 00000000 --rw-rw-rw- rstevens other1 


3.4 使 用 ftok 的 话 ， 系 统 中 男 外 某 个 路 径 名 所 形成 的 链 与 我 们 的 服 
务 硕 所 用 的 键 相同 的 可 能 性 总 是 存在 。 使 用 IPC_PRIVATE 的 话 ， 服 务 
吉 尽 管 知道 它 是 在 创建 新 的 消息 队列 ， 但 它 必须 接着 把 所 创建 消 轧 队 
列 的 标识 符 写 到 某 个 文件 中 ， 供 客户 读 取 。 

3.5 下 面 是 检测 冲突 的 方法 之 一 : 

solaris 96 find / -links 1 -not -type | -print | 


xargs -n1 ftok1 > temp.1 
solaris 96 wc -l temp.1 
109351 temp.1 
solaris 96 sort +0 -1 temp.1 | 
nawk '( if (lastkey == $1) 
print lastline,$0 
lastline = $0 


lastkey = $1 
}' > temp.2 
solaris 96 wc -l temp.2 
82188 temp.2 

在 find 程 序 中 ， 我 们 忽略 链接 数 多 于 一 个 的 文件 (因为 每 个 链接 都 
有 相同 的 索引 节点 ) ， 符 号 链接 也 忽略 (因为 stat 范 数 沿 循 符号 链接 ， 
也 或 是 说 解释 并 替换 符号 链接 ， 直 到 不 再 有 新 的 符号 链接 ) 。 很 高 的 
冲突 比率 (75.2%) 是 由 于 Solaris 2.x 只 使 用 了 索引 节点 号 中 的 12 位 。 这 
意味 着 在 文件 数 多 于 4096 的 任何 文件 系统 中 ， 有 许多 冲突 会 发 生 。 例 
如 索引 节点 号 分 别 为 4096、8192、12288 和 16384 的 4 个 文件 都 有 相同 的 
IPC 键 (假设 它们 在 同一 个 文件 系统 中 ) 。 

下 一 个 例子 运行 在 同样 的 文件 系统 上 ， 但 使 用 的 是 来 自 BSD/OS 的 
ftok 函 数 。 由 于 该 函数 把 整个 索引 节点 号 加 到 键 中 ， 因 此 神 突 数 只 
849 〈 少 于 19%) 。 
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4.44 当 父 进程 终止 时 ， 如 果子 进程 中 fd[1] 处 于 打开 状态 ， 那 么 子 进 
程 对 fd[0] 的 read 不 会 返回 文件 结束 符 ， 因 为 fd[1] 在 子 进 程 中 仍然 打开 。 
在 子 进程 中 关闭 fd[1 保 证 一 旦 父 进程 终止 ， 它 的 所 有 描述 符 即 关闭 ， 
从 而 使 得 子 进 程 对 fd[0] 的 read 返 回 0 » 

4.2 如 有 果 调 用 关系 反 转 了 ， 男 外 某 个 进程 就 有 可 能 在 本 进程 的 open 
和 mkfifo 两 个 调用 之 间 创 建 本 进程 想 要 创建 的 FIFO， 结 果 导 致 本 进程 的 
mkfifo 调 用 失败 。 

4.3 如 果 执 行 如 下 命令 : 


solaris % mainpopen 2>temp.stderr 


/etc/ntp.conf > /myfile 
solaris 96 cat temp.stderr 


sh: /myfile: cannot create 


那么 我 们 看 到 popen 返 回 成 功 ， 但 是 我 们 用 fgets 读 到 的 只 是 一 个 文 
件 结束 和 从。 该 shell 出 错 消 忆 是 写 到 标准 错误 输出 的 。 

4.5 把 第 一 个 open 调 用 改 为 指定 非 阻塞 标志 : 

readfifo = Open(SERV_FIFO,O_RDONLY | O NONBLOCK,0); 

该 调用 将 立即 返回 ， 接 下 去 的 open 调 用 (用 于 只 写 ) 也 立即 返回 ， 
因为 它 要 打开 的 FIFO 已 经 由 第 一 个 open 调 用 打开 用 于 读 。 但 是 为 了 避 
免 从 readline 返 回 错误 ， 描 述 符 readfifo 的 O NONBLOCK 标 志 必 须 在 调 
用 readline 之 前 关 卸 。 

4.6 各 末 窒 户 在 打开 服务 器 的 众所周知 FIFO MAFRA) Zeer 
开 它 的 客户 特定 FIFO (用 于 只 读 ) ， 那 么 会 发 生死 锁 。 避 免 这 种 死 锁 
的 唯一 办 法 是 如 图 4-24 中 所 示 的 顺序 open 这 两 个 FIFO， 也 可 以 使 用 非 阻 
塞 标志 。 

4.7 写 进 程 关 闭 管 道 或 FIFo 的 信息 通过 文件 结束 符 传递 给 读 进 程 。 

4.8 图 D-3 给 出 了 我 们 的 程序 。 

4.9 select 返 回 说 该 描述 符 是 可 写 的 ， 但 调用 write 却 引发 SIGPIPE 信 

。 这 个 概念 在 UNPv1 第 153~155 页 [3] 说 明 过 ， 当 发 生 读 (或 写 ) 错 
误 时 ，select 返 回 说 相应 描述 符 是 可 读 的 (或 可 写 的 ) ， 真 正 的 错误 则 
由 read (或 write) 返回 。 图 D-4 给 出 了 我 们 的 程序 。 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

a-i 

5 int £d[2]; 

6 char buff [7] ; 

7 struct stat info; 

8 if (argc !- 2) 

9 err quit("usage: testl <pathname>") ; 

10 Mkfifo(argv[1], FILE MODE); 

11 fd[0] = Open(argv[1], O RDONLY | O NONBLOCK); 

12 fd[1] = Open(argv[1], O WRONLY | O NONBLOCK); 

13 /* check sizes when FIFO is empty */ 

14 Fstat(fd[0], &info); 

15 printf("fd[0]: st size = $1dWMn", (long) info.st size); 
16 Fstat(fd[1], &info); 

17 printf("fd[1]: st size = %ld\n", (long) info.st size); 
18 Write(fd[1], buff, sizeof (buff)); 

19 /* check sizes when FIFO contains 7 bytes */ 

20 Fstat(fd[0], &info); 

21 printf("fd[0]: st size = $1dWMn", (long) info.st size); 
22 Fstat(fd[1], &info); 

23 printf("fd[1]: st size = %ld\n", (long) info.st size); 
24 exit (0); 

25 ) 


图 D-3 判定 fstat 是 否 返 回 在 茶 个 FIFO 中 的 字 节 数 


pipe/testl.c 


pipe/testl.c 


pipe/test2.c 


1 include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 ( 

5 int fd[2], n; 

6 pid t childpid; 

F fd_set wset; 

8 Pipe (fd); 

9 if ( (childpid = Fork()) == 0) { /* child */ 
10 printf ("child closing pipe read descriptor WM"); 
11 Close (fd[0]) ; 

12 sleep (6) ; 

13 exit (0); 

14 } 

15 /* parent */ 

16 Close (fd[0]); /* in case of a full-duplex pipe */ 
17 sleep(3); 

18 FD ZERO (&wset); 

19 FD SET(fd[1], &wset) ; 

20 n = select (fd[1] + 1, NULL, &wset, NULL, NULL); 
21 printf ("select returned %d\n", n); 

22 if (FD_ISSET(fd[1], &wset)) { 

23 printf ("fd[1] writable\n") ; 

24 Write(fd[1], "hello", 5); 

25 } 

26 exit (0) ; 


pipe/test2.c 


图 D-4 当 一 个 管道 的 读 出 端 关闭 时 ， 判 定 select 为 可 写 性 返回 的 是 什么 
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5.1 先 不 指定 任何 属性 创建 该 队列 ， 紧 接着 调用 mq_getattr 取 得 默认 
属性 。 随 后 删除 该 队列 并 重新 创建 ， 对 未 指定 的 那个 属性 使 用 其 默认 
值 。 

5.2 对 应 第 二 个 消息 的 信号 没有 产生 是 因为 注册 在 每 次 通知 发 生 之 
后 即 撤销 。 

5.3 对 应 第 二 个 消息 的 信号 没有 产生 是 因为 接收 该 消息 时 队列 不 


Ht 


5.4 Solaris 2.6 把 这 两 个 常 值 定义 成 调用 sysconf， 其 上 的 GNU C 编 译 
妖 将 产生 如 下 出 错 消 息 : 
test1.c:13: warning: int format,long int arg (arg 2) 


test1.c:13: warning: int format,long int arg (arg 3) 


5.5 在 Solaris 2.6 下 ， 我 们 指定 1 000 000 个 消息 ， 每 个 消息 10 字 节 。 
这 使 文件 大 小 为 20 000 536 字 节 ， 它 与 我 们 运行 图 5-5 中 程序 所 得 的 结果 
是 一 致 的 : 每 个 消息 占据 10 字 市 数据 、8 字 节 开 销 (也 许 是 为 存放 指 
E 以 及 另外 2 字 节 开销 (也 许 因 4 字 节 对 齐 之 需 ) ， 每 个 文件 再 占据 
536 字 节 开 销 。 在 调用 mq_open 之 前 ， 由 ps 所 报告 的 该 程序 大 小 为 
1052KB, ， 该 消息 队列 创建 之 后 ， 大 小 变 为 20MB。 这 使 得 我 们 认为 
Posix 消 息 队 列 是 使 用 内 存 映射 文件 实现 的 ，mq_open 把 该 文件 映射 到 调 
用 进程 的 地 址 空间 中 。 在 Digital Unix 4.0B 下 我 们 也 取得 了 类 似 的 结 
果 o 

5.. 对 于 ANS..memXXX 函 数 来 说 ， 大 小 参数 为 0 不 成 问题 。 最 初 的 
198.ANS.C 标 准 X3.159-1989 (tE ËR A ISO/IE.9899:1990) 并 没有 这 人 么 
说 ， 作 者 能 找到 的 手册 页 面 也 没有 一 个 提 及 这 一 点 ， 然 而 
“Technica.Corrigendu.Numbe.1 (1 号 技术 勘误 ) ” 却 明 确 陈 述 大 小 为 0 可 
fT (不 过 指针 参数 仍 必 须 有 效 ) 。 要 参阅 有 关 C 语 言 的 信息 ， 
http://www.lysator.liu.se/c/ 是 个 顾 值 访问 的 地 方 。 

5.7 两 进程 之 间 的 双向 通信 需 2 个 消息 队列 (图 A-30 是 这 样 的 一 个 
例子 ) 。 事 实 上 ， 要 是 我 们 把 图 4-14 中 程序 改 为 使 用 Posix 消 息 队 列 而 
不 是 管道 ， 就 会 看 到 父 进程 读 回 它 写 到 队列 中 的 东西 。 

5.8 互 不 锁 和 条 件 变 量 包 含 在 内 存 映射 文件 中 ， 而 该 文件 是 由 打开 
了 相应 队列 的 所 有 进程 共享 的 。 其 他 进程 也 许 打开 着 该 队列 ， 因 此 即 
将 关闭 该 队列 本 地 句柄 的 一 个 进程 不 能 摊 毁 该 互 斥 锁 和 条 件 变 量 。 

5.9 C 语 言 中 数组 不 能 通过 等 号 赋值 ， 结 构 却 可 以 。 

5.10 main 函 数 几 乎 把 所 有 时 间 都 花 在 select 调 用 的 阻塞 之 中 ， 等 符 
管道 变 为 可 读 。 每 次 提交 相应 信号 时 ， 其 信号 处 理 程序 的 返回 会 中 断 
这 个 select 调 用 ， 使 得 它 返 回 一 个 EINTR 错 误 。 为 处 理 这 种 情形 ， 我 们 
的 Select 包 于 函 数 检查 这 个 错误 ， 并 重新 调用 select， 如 图 D-5 所 示 。 


lib/wrapunix.c 


313 int 
314 Select(int nfds, fd set *readfds, fd set *writefds, fd set *exceptfds, 
315 struct timeval *timeout) 
316 ( 
317 int n; 
318 again: 
319 if ( (n = select(nfds, readfds, writefds, exceptfds, timeout)) < o)( 
320 if (errno -- EINTR) 
图 D-5 处 理 EINTR 的 Select 包 圳 函数 
321 goto again; 
322 else 
323 err sys("select error"); 
324 } else if (n == 0 && timeout == NULL) 
325 err quit ("select returned 0 with no timeout"); 
326 return (n); /* can return 0 on timeout */ 
327 } 


lib/wrapunix.c 


图 D-5 ( 续 ) 
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6.1 其 余 程序 必须 接受 数值 形式 的 消息 队列 标识 符 ， 而 不 是 路 径 名 
(回想 一 下 图 6-3 中 程序 的 输出 ) 。 这 些 程序 上 的 如 此 变动 既 可 通过 增 
设 一 个 新 的 命令 行 选项 做 到 ， 也 可 假设 完全 为 数值 的 路 径 名 参数 是 标 
识 符 而 不 是 真 的 路 径 名 。 既 然 传 递 给 ftok 的 多 数 路 径 名 是 绝对 路 径 名 而 
不 是 相对 路 径 名 (也 就 是 说 它们 至 少 包 含 一 个 斜 杠 符 ) ， 这 样 的 假设 
也 许可 行 。 

6.2 类 型 为 0 的 消息 是 不 被 允许 的 ， 而 客户 是 决 不 可 能 有 1 这 个 进程 
ID 的 ， 因 为 它 通常 是 init 进 程 的 进程 ID © 

6.3 当 如 图 6-14 所 示 只 使 用 一 个 队列 时 ， 这 个 恶意 的 客户 影响 所 有 
其 他 客户 。 当 给 每 个 客户 准备 一 个 返 送 队列 时 (图 6-19) ， 这 个 客户 只 
能 影响 它 自己 的 队列 。 
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7.2 进程 将 终止 ， 而 且 可 能 是 在 消费 者 线程 完成 之 前 ， 因 为 调用 
exit 将 终止 任何 仍 在 运行 中 的 线程 。 

7.3 Solaris 2.6 下 ， 省 上 略 destroy 芳 数 的 调用 导致 内 存 泄漏 ， 上 暗示 init 
函数 是 在 执行 动态 内 存 分 配 。 在 Digital Unix 4.0B 下 ， 我 们 没有 看 到 这 
种 现象 ， 这 意味 着 实现 上 存在 差异 。 

不 过 调用 匹配 的 destroy 函 数 仍 是 需要 的 。 从 实现 的 角度 看 ，Digital 
Unix 像 是 把 attr_t 变 量 用 作 属 性 对 象 本 号 ，Solaris 则 把 该 变量 用 作 指 网 动 
人 态 分 配对 象 的 指针 。 这 两 种 实现 都 是 可 行 的 。 
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9.1 你 可 能 需要 把 原来 为 20 的 循环 计数 加 大 才能 看 到 这 些 错误 ， 这 
取决 于 你 的 系统 。 

9.2 要 使 标准 WO 流 不 缓冲 ， 我 们 在 main 芳 数 的 for 人 循环 之 前 插入 如 
PIT: 

setvbuf(stdout, NULL, IONBF,0); 

这 么 修改 不 应 该 有 任何 效果 ， 因 为 printf 调 用 只 有 一 个 ， 而 且 所 输 
出 字符 串 是 以 换行 符 结 尾 的 。 通 第 情 况 下 ， 标 准 输 出 是 行 缓冲 的 ， 
此 不 论 哪 种 缓冲 方式 〈 行 缓冲 或 不 缓冲 ) ， 这 个 单独 的 printf 调 用 最 终 
变 为 对 内 核 的 单个 write 调用 。 

9.3 我 们 把 printf 调 用 改 为 : 

snprintf(line,sizeof(line),"96s: pid = %ld,seq# = %d\n", 

argv[0],(long)pid,seqno); 

for (ptr = line; (c = *ptr++)!= 0; ) 

putchar(c); 

并 声明 c 是 一 个 整数 ，ptr 的 类 型 为 char *。 保 留 上 一 道 习题 所 加 的 
setvbuf 调 用 不 变 ， 从 而 使 得 标准 输出 变 为 不 缓冲 ， 于 是 标准 MO 函 数 库 
给 所 输出 的 每 个 字符 调用 一 次 write， 而 不 是 每 行 调用 一 次 。 这 么 一 来 


需要 更 多 的 CPU 时 间 ， 内 核 在 两 个 进程 之 间 来 回 切换 的 机 会 也 增多 。 我 
们 应 该 从 这 个 程序 的 运行 中 看 到 更 多 的 错误 。 

9.4 既然 对 于 一 个 文件 的 同一 区 段 允 许多 个 进程 有 读 出 锁 ， 那 么 殉 
我 们 的 例子 而 言 ， 这 与 没有 任何 锁 是 一 样 的 。 

9.5 没有 任何 变化 ， 因 为 一 个 描述 符 的 非 阻 塞 标志 对 于 fcnt 劝 告 性 
上 锁 没有 影响。 决定 fcntl 调 用 是 否 阻 窗 的 是 其 命令 FE_SETLKW 表 明 总 
是 阻塞 ，F_SETLK 则 表明 永 不 阻塞 。 

9.6 loopfcntlnonb 程 序 运行 如 常 ， 因 为 我 们 已 在 上 一 道 习 题 展 示 ， 
非 阻塞 标志 对 于 执行 fcnttL 上 锁 的 程序 没有 影响 。 然 而 非 阻塞 标志 确实 影 
咱 不 执行 上 锁 的 loopnonenonb 程 序 。 我 们 在 9.5 和 说 过 ， 如 果 对 启用 了 强 
制 性 上 锁 的 文件 所 进行 的 read 或 write 非 阻塞 调用 与 已 有 的 锁 发 生 冲 突 ， 
那么 会 返回 一 个 EFAGAIN 错 误 。 我 们 看 到 的 这 个 错误 或 者 是 

read error: Resource temporarily unavailable 

或 者 是 

write error: Resource temporarily unavailable 

通过 执行 如 下 命令 就 能 验证 这 个 错误 是 EAGAIN: 

solaris % grep Resource /usr/include/sys/errno.h 

#define EAGAIN 11 /* Resource temporarily unavailable */ 

9.7 Solaris 2.6 下 ， 强 制 性 上 锁 增 加 了 约 16% 的 时 钟 时 间 和 约 20% 的 
系统 CPU 时 间 。 用 户 CPU 时 间 保 持 不 变 ， 正 如 我 们 所 预期 的 那样 ， 这 是 
因为 额外 的 时 间 花 在 了 内 核对 每 个 read 和 write 调 用 的 检查 上 ， 而 不 是 在 
HAPHE? 

9.8 锁 是 以 每 个 进程 为 基 而 不 是 以 每 个 线程 为 基 授 予 的 。 要 看 到 上 
锁 请 求 鸭 竞争 现象 ， 我 们 必须 让 不 同 的 进程 来 党 试 获取 锁 。 

9.9 如 果 本 守护 进程 的 男 一 个 副本 正在 运行 ， 当 使 用 O_TRUNC 标 
志 open 时 ， 由 本 守护 进程 的 第 一 个 副本 存放 的 进程 有 D 束 会 被 冲 掉 。 我 
们 只 有 获悉 目 己 是 唯一 在 运行 的 副本 后 ， 才 能 截 掉 文 件 内 容 。 


9.10 SEEK_SET 总 是 最 可 取 的 。SEEK_CUR 的 问题 是 它 取 决 于 文件 
中 的 当前 偏 移 量 ， 而 该 值 是 由 lseek 指 定 的 。 但 是 如 果 在 调用 lseek 之 后 
调用 fcntl， 那 么 我 们 是 在 使 用 两 个 画 数 调用 完成 单个 操作 的 任务 ， 而 这 
两 个 函数 调用 之 间 存 在 由 另外 一 个 线程 通过 调用 lseek 修 改 当 前 偏 移 量 
的 机 会 。 (回想 一 下 所 有 线程 共享 相同 的 描述 符 。 男 外 回想 一 下 fcntl 记 
杂 锁 用 于 不 同 进程 之 则 的 上 锁 ， 而 不 是 单个 进程 内 的 不 同 线程 之 间 的 
上 锁 。) 同样 ， 如 果 我 们 指定 SEEK_END， 那 么 在 基于 所 认定 的 文件 
尾 获 得 一 个 锁 之 前 ， 另 外 一 个 线程 有 可 能 已 往 该 文件 添加 数据 。 
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10.1 以 下 是 在 Solaris 2.6 下 的 结果 输出 : 

solaris % deadlock 100 

prod: calling sem_wait(nempty) 生产 者 i=0 时 的 循环 


prod: got sem. wait(nempty) 


prod: calling sem wait(mutex) 

prod: got sem  wait(mutex),storing 0 

prod: calling sem_wait(nempty) 生产 者 i=1 时 的 循环 

prod: got sem_wait(nempty) 

prod: calling sem wait(mutex) 

prod: got sem  wait(mutex),storing 1 

prod: calling sem wait(nempty) 开始 下 一 轮 循环 ， 
但 没有 空 槽 位 


上 下 文 从 生产 者 切换 到 消费 者 
cons: calling sem wait(mutex) 消费 者 i=0 时 的 循环 
cons: got sem wait(mutex) 
cons: calling sem wait(nstored) 
cons: got sem wait(nstored) 


cons: fetched 0 


cons: calling sem. wait(mutex) 消费 者 i=1 时 的 循环 

cons: got sem  wait(mutex) 

cons: calling sem wait(nstored) 

cons: got sem wait(nstored) 

cons: fetched 1 

cons: calling sem, wait(mutex) 

cons: got sem wait(mutex) 

cons: calling sem wait(nstored) 消费 者 永远 阻塞 于 此 

上 上 下文 从 消费 者 切换 到 生产 者 

prod: got sem_wait(nempty) 

prod: calling sem_wait(mutex) 生产 者 永远 阻塞 于 
此 

10.2 在 我 们 摘 述 sem_open 时 指定 了 信和 号 量 初始 化 规则 的 前 提 下 ， 
这 是 可 行 的 。 该 规则 说 ， 如 果 信 号 量 已 经 存在 ， 它 吏 不 被 初始 化 。 
此 这 4 个 进程 中 ， 只 有 第 一 个 调用 sem_open 的 进程 才 真 正 把 信号 量 的 值 
初始 化 为 1。 当 其 余 3 个 进程 以 O_CREAT 标 志 调 用 sem_open 时 ， 所 需 信 
号 量 已 经 存在 ， 其 值 于 是 不 再 被 初始 化 。 

10.3 这 确实 是 个 问题 。 信 号 量 在 该 进程 终止 时 被 自动 关闭 ， 但 是 
其 值 并 没有 改变 。 这 将 妨碍 其 他 3 个 进程 中 的 任何 一 个 取得 所 需 的 锁 ， 
从 而 导致 另外 一 种 类 型 的 死 锁 。 

10.4 要 是 我 们 没有 把 这 两 个 描述 符 初 始 化 为 -1， 那 么 它们 的 初始 值 
是 不 确定 的 ， 因 为 malloc 并 不 对 它 分 配 的 内 存 进 行 初始 化 。 这 么 一 来 ， 
如 宁 有 一 个 open 调 用 失败 ，error 标 号 处 的 close 调 用 就 可 能 关闭 该 进程 正 
在 使 用 的 肤 个 描述 符 。 把 描述 符 初 始 化 为 -1 后 ， 我 们 可 知 如 宋 描 述 符 疝 
未 被 打开 则 close 调 用 不 会 有 什么 后 果 〈 除 返回 一 个 我 们 忽略 掉 的 错误 
外 ) 


10.5 尽管 很 小 ， 却 存在 这 样 的 机 会 : close 调 用 虽然 针对 一 个 有 效 
的 描述 符 ， 但 仍 可 能 返回 某 个 错误 ， 从 而 把 errmno 由 我 们 想 返 回 的 值 改 
为 其 他 值 。 既 然 我 们 想 要 保存 errno 值 以 返回 给 调用 者 ， 显 式 地 去 做 总 
比 依赖 某 些 副作用 (例如 当 关 闭 的 是 一 个 有 效 的 描述 符 时 ，close 调 用 
不 会 返回 错误 ) 来 得 好 。 

10.6 这 个 函数 中 不 存在 竞争 状态 ， 因 为 如 果 所 需 的 FIFO 已 经 存 
在 ，mkfifo 函 数 将 返回 一 个 错误 。 如 果 有 两 个 进程 几乎 同时 调用 这 个 函 
数 ， 那 么 相应 的 FIFO 只 创建 一 次 。 调 用 mkfifo 的 第 二 个 进程 将 收 到 一 个 
EEXIST 销 误 ， 导 致 O CREAT 标 志 被 天 掉 ， 从 而 防止 再 次 初始 化 同一 个 
FIFO 。 

10.7 图 10-37 没 有 我 们 随 图 10-43 描 述 的 竞争 状态 ， 因 为 其 信号 量 的 
初始 化 是 通过 写 数据 到 相应 的 FIFO 完 成 的 。 如 果 创 建 该 FIFO 的 进程 在 
调用 mkfifo 之 后 但 在 向 该 FIFO write 数据 字 节 之 前 被 内 核 挂 起， 那么 第 
二 个 进程 只 是 打开 该 FIFO， 随 后 在 自 次 调用 sem_wait 处 阻塞， 因为 这 
个 新 创建 的 FIFO 在 第 一 个 进程 〈《 即 创建 该 FIFO 的 进程 ) 往 它 写 数据 字 
节 前 一 直 为 空 。 

10.8 图 D-6 给 出 了 该 测试 程序 。Solaris 2.6 和 Digital Unix 4.0B 上 的 
实现 都 检测 被 某 个 捕获 的 

言 号 中 断 的 情况 ， 并 返回 EINTR 错 误 。 


pxsem/testeintr.c 
1 #include "unpipc.h" 


N 


#define NAME "testeintr" 
3 static void sig alrm(int); 
int 


4 
5 main(int argc, char **argv) 
6 
T 


{ 


sem_t *seml, sem2; 


8 /* first test a named semaphore */ 
9 sem unlink(Px ipc name (NAME) ) ; 
10 seml = Sem open(Px ipc name(NAME), O_RDWR | O CREAT | O EXCL, 
Ti FILE_MODE, 0); 
12 Signal(SIGALRM, sig alrm); 
i3 alarm(2); 
14 if (sem wait (seml) == 0) 
15 printf ("sem wait returned 0?\n") ; 
16 else 
17 err ret("sem wait error"); 
18 Sem close (seml); 
19 /* now a memory-based semaphore with process scope */ 
20 Sem init(&sem2, 1, 0); 
21 alarm(2); 
22 if (sem wait(&sem2) == 0) 
23 printf ("sem wait returned 0?\n"); 
24 else 
25 err ret("sem wait error"); 
26 Sem destroy (&sem2) ; 
29 exit(0); 
28 } 


29 static void 
30 sig alrm(int signo) 


31 { 

32 printf ("SIGALRM caught n"); 
33 return; 

34 ) 


pxsem/testeintr.c 


图 D-6 测试 sem_wait 是 否 返 回 EINTR 


我 们 使 用 FIFO 的 实现 会 返回 EINTR， 因 为 sem_wait 阻 塞 在 对 于 一 个 
FIFO 的 某 个 read 调 用 中 ， 而 read 调 用 必须 返回 EINTR 错 误 。 我 们 使 用 内 
存 映 射 IO 的 实现 不 返回 任何 错误 ， 因 为 sam wait BE. 3€ f£ 3E 7 
pthread_cond_wait 调 用 中 ， 而 该 函数 被 一 个 捕获 的 信号 中 断 时 并 不 返回 
EINTR» (我 们 在 图 5-29 中 看 到 过 另外 一 个 例子 。) 我 们 使 用 System V 
言 号 量 的 实现 返回 EINTR， 因 为 sem_wait 阻 塞 在 某 个 semop 调 用 中 ， 而 
semop 调 用 返回 EINTR 错 误 。 


10.9 使 用 FIFO 的 实现 (图 10-40) 是 异步 信号 安全 的 ， 因 为 write 是 
异步 信号 安全 的 。 使 用 内 存 映 射 文件 的 实现 (图 10-47) 则 不 是 ， 因 为 
没有 一 个 pthread_XXX 函 数 是 异步 信号 安全 的 。 使 用 System V 信 号 量 的 
实现 (图 10-56) 也 不 是 ， 因 为 Unix 98 没 有 把 semop 列 为 异步 信号 安全 
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11.1 只 需 修改 其 中 一 行 : 

< semid = Semget(Ftok(argv[optind],0),0,0); 


> semid = atol(argv[optind]); 

11.2 ftok 调 用 将 失败 ， 从 而 导致 我 们 的 Ftok 包 于 函数 的 终止 。 
my. lock EX Zi n] TE Yi] Hl semgetZ BV A ftok, T A 773k I[ENOENT E 
误 ， 大 LOCK_PATH 文 件 不 存在 则 创建 它 。 
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12.1 文件 大 小 将 再 增长 4 096 字 节 (达到 36 864 字 节 ) ， 最 后 一 个 
printf 对 新 文件 结束 符 (ptr 字 符 数组 的 对 应 下 标 为 36863) 所 作 的 引用 可 
能 引发 SIGSEGV 信 号 ， 因 为 内 存 映 射 区 的 大 小 为 32 768 字 三。 我 们 说 
“可 能 ”而 不 是 “将 ”的 原因 在 于 ， 该 信号 产生 与 否 取决 于 页 面 大 小 。 

12.2 图 D-7 是 使 用 System VB AMAIA BATRA, ÉL D-82 
使 用 通过 mmap 实 现 的 Posix 消 息 队 列 发 送 消 居 的 示 童 图。 图 D-8 中 发 送 
者 的 memcpy 发 生 在 调用 mq_send 期 间 (图 5-30) ， 接 收 者 的 memcpy 则 
发 生 在 调用 mq_receive 期 间 (图 5-32) ° 


msgsnd() 


msgrcv () 


进程 内 核 
System V 
消息 队列 
图 D-7 使 用 System V 消 息 队 列 发 送 消 息 
5 
I | 
| | 
memcpy () 共享 内 存 中 的 | 
| 接收 者 Posix 消 息 队 列 
1 接收 老 地 址 空 i : 
L 接收 者 地 址 空间 O O O LL | j 发 送 者 地 址 空间 
进程 内 核 


内 核 的 虚 存 算法 保持 普通 
文件 与 内 存 映 射 区 同步 


图 D-8 使 用 通过 mmap 实 现 的 Posix 消 息 队 列 发 送 消 息 


12.3 对 /devwzero 设 备 文件 的 任何 read， 所 返回 的 是 所 请 求 数目 的 全 
为 0 的 字 节 。write 到 该 设备 的 任何 数据 被 直接 丢弃 掉 ， 束 像 write 
到 /dev/null 设 备 一 样 。 

12.4 该 文件 的 最 终 内 容 为 4 字 节 的 0 (假设 int 类 型 为 32 位 ) 。 

12.5 图 D-9 给 出 了 我 们 的 程序 。 


shm/svmsgread.c 


1 #include "unpipc.h" 
2 #define MAXMSG (8192 + sizeof (long)) 


3 int 


4 main(int argc, char **argv) 


5 { 


oon 0 


int pipel[2], pipe2[2], mqid; 
char es 

pid t  childpid; 

fd set rset; 

ssize t n, nread; 

struct msgbuf *buff; 


if (arge != 2) 
err quit("usage: svmsgread <pathname>") ; 


Pipe (pipel) ; /* 2-way communication with child */ 
Pipe (pipe2) ; 
buff = My_shm(MAXMSG) ; /* anonymous shared memory with child */ 
if ( (childpid = Fork()) == 0) { 

Close (pipel [1] ) ; /* child */ 


Close (pipe2 [0] ) ; 


mqid = Msgget (Ftok(argv[1], 0), MSG R); 
for (zgi 
/* block, waiting for message, then tell parent */ 
nread = Msgrcv(mqid, buff, MAXMSG, 0, 0); 
Write (pipe2[1], &nread, sizeof (ssize_t)); 


/* wait for parent to say shm is available */ 
if ( (n = Read(pipel[O], &c, 1)) != 1) 
err quit("child: read on pipe returned %d", n); 
} 
exit(0); 
) 
/* parent */ 
Close (pipel [0]) ; 
Close (pipe2 [1] ); 


FD ZERO(&rset); 
FD SET(pipe2[0], &rset); 
for (sali 
if ( (n = select (pipe2[0] + 1, &rset, NULL, NULL, NULL)) != 1) 
err sys("select returned %d", n); 
if (FD ISSET(pipe2[0], &rset)) ( 
n - Read(pipe2[0], &nread, sizeof(ssize t)); 
if (n != sizeof(ssize t)) 
err quit("parent: read on pipe returned $d", n); 
printf ("read $d bytes, type = $1dWMn", nread, buff-»mtype); 
Write(pipel[1], &c, 1); 
) eise 
err quit("pipe2[0] not ready"); 
) 
Kill(childpid, SIGTERM); 
exit(0); 


shm/svmsgread.c 


图 D-9 父子 进程 设置 成 对 System V 消 息 使 用 select 的 例子 
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13.1 图 D-10 给 出 了 图 12-16 的 修改 后 版 本 ， 图 D-11 给 出 了 图 12-19 的 
修改 后 版 本 。 注 意 在 第 一 个 程序 中 ， 我 们 必须 使 用 ftruncate 设 置 共 享 内 
存 对 象 的 大 小 ， 而 不 能 使 用 lseek 和 write。 


pxshm/testl.c 


1 #include "unpipc.h" 

2 int 

3 main(int argc, char **argv) 

4 ( 

5 int fd, dij 

6 char *ptr; 

7 size t shmsize, mmapsize, pagesize; 

8 if (argc != 4) 

9 err quit("usage: testl «name» «shmsize» <mmapsize>") ; 

10 shmsize = atoi(argv[2]); 

11 mmapsize = atoi(argv[3]); 

12 /* open shm: create or truncate; set shm size */ 

i3 fd - Shm open(Px ipc name(argv[1]), O RDWR | O CREAT | O TRUNC, 
14 FILE MODE); 

15 Ftruncate (fd, shmsize) ; 

16 ptr=Mmap (NULL, mmapsize, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 
17 Close(fd); 

18 pagesize - Sysconf( SC PAGESIZE); 

19 printf("PAGESIZE = %ld\n", (long) pagesize) ; 
20 for (i = 0; i < max(shmsize, mmapsize); i += pagesize) { 
2T printf("ptr[$d] = $dWMn", i, ptr[il]); 
22 ptr[i] = 1; 
23 printf ("ptr[%d] = %d\n", i + pagesize - 1,ptr[i + pagesize - 11); 
24 ptr[i + pagesize - 1] = 1; 
25 } 
26 printf ("ptr[%d] = $dWMn", i, ptrlil); 
27 exit (0) ; 
28 } 


pxshm/testl.c 


AID-10 访问 其 大 小 可 能 不 同 于 共享 内 存 区 大 小 的 mmap 


pxshm/test2.c 


1 #include "unpipc.h" 


2 #define FILE "test.data" 
3 #define SIZE 32768 


4 int 

5 main(int argc, char **argv) 

6 { 

" int fd. i; 

8 char *ptr; 

9 /* open shm: create or truncate; then mmap shm */ 


10 fd-Shm open(Px ipc name(FILE),O RDWR|O CREAT|O TRUNC, FILE MODE); 
qd. ptr - Mmap(NULL, SIZE, PROT READ | PROT WRITE, MAP SHARED, fd, 0); 


图 D-11 允许 共享 内 存 区 大 小 增长 的 内 存 映射 例子 


12 for (i = 4096; i «- SIZE; i «- 4096) ( 

15 printf("setting shm size to %d\n", i); 
14 Ftruncate(fd, i); 

15 printf("ptr[$d] = $dWMn", i-1, ptr[i-11); 
16 

17 exit(0); 

18 ) 


pxshm/test2.c 


图 D-11 (2%) 


13.2 *ptr++ 可 能 存在 的 问题 之 一 是 由 mmap 返 回 的 指针 被 改 摊 ， 从 


而 妨碍 以 后 调用 munmap 。 


改 。 


如 琳 以 后 要 用 到 该 指针 ， 我 们 就 得 把 它 保 存 起 来 ， 或 者 不 作 修 


第 14 章 


14.1 只 有 一 行 需要 改动 : 

第 15 章 

13c13 

< id = Shmget(Ftok(argv[1],0),0,SVSHM_MODE);--- 
> id = atol(argv[1]); 


151 这 样 的 参数 的 字 "D BW 为 datasize+ 


(desc num*sizeof(door desc t)) ° 


15.2 没有 调用 fstat 的 必要 。 如 果 所 打开 的 描述 符 指 代 的 不 是 一 个 
门 ， 那 么 door info 将 返回 一 个 EBADF 错 旋 : 

solaris 96 doorinfo /etc/passwd 

door info error: Bad file number 

15.3 该 手册 页 面 是 错误 的 。Posix.1 对 此 的 正确 陈述 为 “The 
sleep()function shall cause the current thread to be suspended from 
execution.” (Sleep 函数 会 导致 当前 线程 从 执行 状态 挂 起 ) 。 

15.4 结果 难以 预料 (尽管 核心 转 储 是 一 个 相当 安全 的 猜测 ) ， 
为 与 其 中 的 门 相关 联 的 服务 器 过 程 的 地 址 会 导致 在 新 执行 的 程序 中 ， 
某 段 随机 的 代码 会 被 作为 一 个 函数 来 调用 。 

15.5 当 客 户 的 door_call 被 所 捕获 的 信号 中 断 时 ， 服 务 絮 进程 必须 被 
通知 到 ， 因 为 它 需 随后 向 处 理 该 客户 的 服务 器 线程 〈 它 的 也 在 我 们 的 
输出 例子 中 为 4) 发 送 一 个 取消 请 求 ， 然 而 我 们 随 图 15-23 说 过 ， 对 于 由 
门 贸 数 库 目 动 创建 的 所 有 服务 器 线程 来 说 ， 取 消 操 作 是 被 禁止 的 ， 我 
们 正 讨 论 的 线程 于 是 不 会 因 取 消 而 终止 。 相 反 ， 当 客户 的 door_call 被 终 
止 时 ， 服 务 器 过 程 阻 塞 在 其 上 的 sleep(6) 调 用 看 来 在 该 过 程 被 调用 后 约 2 
秒 钟 瓯 过 时 地 返回 了 。 但 是 执行 该 过 程 的 服务 器 线程 仍 持续 运行 到 完 
成 为 止 。 

15.6 我 们 看 到 的 错误 如 下 : 


solaris % server6 /tmp/door6 


my_thread: created server thread 4 


door_bind error: Bad file number 
当 我 们 连续 启动 该 服务 器 20 次 时 ， 该 错误 出 现 了 5 次 。 该 错误 是 不 


15.7 不 需要 。 我 们 需 做 的 只 是 如 图 15-31 中 那样 ， 每 次 服务 器 过 程 
被 调用 时 就 局 用 取消 。 


这 种 技术 尽管 在 服务 右 过 程 每 次 被 沂 活 时 都 要 调用 
pthread setcancelstate, ， 而 不 是 仅 在 执行 该 过 程 的 线程 启动 时 调用 一 
次 ， 但 其 开销 却 可 能 很 小 。 

15.8 为 验证 这 一 点 ， 我 们 将 某 个 服务 器 程序 〈 辟 如 说 图 15-9) 改 为 
从 服务 器 过 程 中 调用 door_revoke。 由 于 门 撒 述 符 是 door_revoke 的 参 
数 ， 因 此 我 们 还 得 把 fd 改 成 一 个 全 局 变量 。 我 们 随后 执行 相应 的 客户 程 
Fe ( 壁 如 说 图 15-2) WA: 

solaris % client8 /tmp/door8 88 

result: 7744 

solaris % client8 /tmp/door8 99 


door_call error: Bad file number 

第 一 次 激活 服务 硕 过 程 成 功 返 回 ， 从 而 证 实 door_revoke 不 影 啊 已 
在 进行 的 调用 。 第 二 次 激活 告知 从 door_call 返 回 的 错误 是 EBADF 。 

15.9 为 避免 使 fd 成 为 一 个 全 局 变量 ， 我 们 使 用 传递 给 door_create 的 
cookie 指 秆 ， 该 指针 随后 在 服务 器 过 程 每 次 被 调 用 时 传递 给 它 。 图 D-12 
给 出 了 服务 器 程序 。 


doors/server9.c 


1 #include "unpipc.h" 
2 void 
3 servproc(void *cookie, char *dataptr, size t datasize, 
4 door desc t *descptr, size t ndesc) 
5 { 
6 long arg, result; 
7 Door revoke (*((int *) cookie) ) ; 
8 arg = *((long *) dataptr) ; 
9 printf ("thread id $1d, arg = %ld\n", pr thread id(NULL), arg); 
10 result = arg * arg; 
EL Door return((char *) &result, sizeof (result); NULL, 0); 
12 } 
13 int 
14 main(int argc, char **argv) 
15 
16 int fd; 
17 if (argc !- 2) 
18 err quit("usage: server9 <server-pathname>") ; 
19 /* create a door descriptor and attach to pathname */ 
20 fd - Door create(servproc, &fd, 0); 
21 unlink (argv [1]) ; 
22 Close(Open(argv[1], O CREAT | O RDWR, FILE MODE)); 
23 Fattach(fd, argv[11); 
24 /* servproc() handles all client requests */ 
25 for Cap) 
26 pause() ; 
27 } 


doors/server9.c 


图 D-12 使 用 cookie 指 针 以 避免 使 fd 成 为 一 个 全 局 变量 


我 们 可 以 很 容易 地 对 图 15-22 和 图 15-23 作 同样 的 修改 ， 因 为 cookie 
指针 对 我 们 的 my_create 芳 数 而 言 是 可 得 的 (该 指针 在 door_info_t 结 构 
H) ， 而 该 函数 又 把 指向 该 结构 的 指针 传递 给 新 创建 的 线程 CEU 
对 应 door_bind 调 用 的 描述 符 ) 。 

15.10 本 例 中 线程 属性 从 不 改变 ， 因 此 我 们 可 以 只 初始 化 一 次 线程 
属性 “在 main 函 数 中 完成 ) 。 
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16.1 端口 映射 锅 并 不 监视 已 问 它 注册 的 各 个 服务 硕 ， 因 而 无 法 检 
测 亡 们 是 否 裔 省。 终止 其 中 某 个 服务 右 后 ， 它 在 端口 映 映 右 中 注册 的 
了 映射 关系 并 不 注销 ， 这 一 点 可 使 用 rpcinfo 程 序 来 验证 。 这 么 一 来 ， 该 服 
务 圳 终止 后 ， 与 端口 映射 器 联系 以 获取 该 服务 露 端口 号 的 某 个 客户 将 


得 到 肯定 的 答复 ， 由 端口 映射 器 返回 该 服务 需 在 终止 之 前 使 用 的 端口 
号 。 假 设 该 服务 辟 是 一 个 TCP 服 务 右 ， 当 该 客户 试图 与 它 联系 时 ， 客 户 
方 RPC 运 行 时 环境 将 收 到 RST (复位 ;分 节 作为 对 SYN 分 节 的 响应 (前 
提 是 自 该 服务 器 终止 以 来 ， 服务器 主机 上 没有 其 他 进程 被 赋予 同样 的 
端口 ) ， 从 而 导致 从 clnt_create 返 回 一 个 错误 。UDP 客 户 调用 clnt_create 
将 成 功 (因为 没有 连接 需要 建立 ) 。 但 是 当 它 向 以 前 的 服务 器 端口 发 
送 UDP 数据 报时 ， 什 么 应 答 都 不 会 返回 〈 同 样 假设 目 该 服务 器 终止 以 
来 ， 服 务 器 主机 上 没有 其 他 进程 被 赋予 同样 的 端口 ) ， 该 客户 的 远程 
过 程 调用 最 终 将 超时 e 

16.2 当 收 到 服务 器 的 第 一 个 应 答 后 ，RPC 运 行 时 环境 把 它 返回 给 客 
户 ， 这 发 生 在 客户 发 出 远程 过 程 调用 后 约 20 秒 。 因 超时 重 传 导致 的 服 
务 颖 的 下 一 个 应 答 将 一 直 存 留 在 客户 方 端点 的 网 络 缓冲 区 中 ， 直 到 该 
端点 被 关闭 ， 或 者 直到 RPC 运 行 时 环境 下 一 次 读 该 缓冲 区 为 止 。 现 在 假 
设 客户 在 收 到 第 一 个 应 管 后 立即 向 服务 妖 再 次 发 出 调用 [5] ， 再 假设 没 
有 网 络 分 组 丢失 现象 ， 下 一 个 到 达 客 户 方 端点 的 数据 报 将 是 服务 颖 对 
于 客户 的 超时 重 传 的 应 答 。 然 而 RPC 运 行 时 环境 将 忽略 这 个 应 答 ， 因 为 
它 的 XID 对 应 于 客户 的 第 一 次 远程 过 程 调 用 ， 它 不 可 能 与 客户 的 第 二 次 
过 程 调用 所 用 的 XID 相 同 。 

16.3 构造 一 个 成 员 为 char c[10] 的 C 结 构 ， 不 过 XDR 将 把 它 编码 成 10 
个 4 字 节 整数 。 要 是 你 确实 需要 定 长 的 字符 串 ， 那 就 使 用 定 长 的 不 透明 
数据 类 型 。 

16.4 xdr_data 调 用 返回 FALSE， 因 为 它 的 xdr_string 调 用 返回 FALSE 

(参见 data_xdr.c 文 件 ) 。 

当 指 定 一 个 最 大 长 度 时 ， 它 将 作为 xdr_string 的 最 后 一 个 参数 编 
码 。 当 省 略 这 个 最 大 长 度 时 ， 最 后 一 个 参数 是 0 的 反 码 (在 32 位 整数 前 
提 下 ， 其 值 为 22 -1) 。 


16.5 所 有 的 XDR 例 程 都 检查 缓冲 区 中 是 否 有 足够 的 空间 以 存放 将 
编码 到 其 中 的 数据 ， 当 缓冲 区 满 时 返回 FALSE 错 误 。 不 驻 的 是 ， 没 有 办 
法 区 别 来 自 XDR 函 数 的 各 种 不 同 的 可 能 错误 。 

16.6 我 们 可 以 说 TCP 使 用 序列 号 检测 重复 数据 在 效果 上 等 同 于 重复 
请 求 高 速 缓存 ， 因 为 对 于 作为 含有 TCP 已 确认 过 的 重复 数据 而 到 达 的 任 
何 旧 分 节 ， 这 些 序 列 号 都 能 将 其 标识 出 来 。 对 于 一 个 给 定 的 连接 ( 例 
如 一 个 给 定 客 户 的 了 P 地 址 和 端口 ) ， 该 高 速 缓存 的 大 小 是 TCP 的 32 位 序 
列 号 空间 的 一 半 ， 也 就 是 231 BEZJ2G*E 。 

16.7 由 于 对 一 个 给 定 的 请 求 来 说 ， 它 的 所 有 5 个 值 必须 等 于 某 个 高 
速 缓存 项 中 对 应 的 5 个 值 ， 因 此 第 一 个 作 比 较 的 值 应 该 是 最 可 能 不 等 的 
那个 值 ， 而 最 后 一 个 作 比 较 的 值 应 该 是 最 可 能 相等 的 那个 值 。 在 TI- 
RPC 软 件 包 中 ， 真 正 的 比较 顺序 是 : (1) XID, (2) 过 程 号 ， (3) 
版 本 号 ， (4) BRS, (5) 客户 地 址 。 在 XID 随 每 个 请 求 变化 的 前 提 
下 ， 首 先 对 它 进行 比较 是 明智 的 。 

16.8 在 图 16-30 中 ， 从 标志 /长 度 字 段 开 始 ， 包 括 4 字 市 的 长 整数 过 
程 参数 在 内 ， 共 有 12 个 4 字 世 字段， 合计 48 字 节 。 按 照 默 认 的 无 认证 配 
置 ， 凭 证 数据 和 验证 器 数据 均 为 空 。 也 就 是 说 ， 和 凭证 和 验证 器 均 占 用 8 
FZP: 4 字 节 指定 认证 方式 (AUTH_NONE) ， 另 4 字 节 指定 认证 长 度 

(其 值 为 0; 。 

ENA TH (看 图 16-32， 但 要 意识 到 由 于 在 使 用 TCP， 因 此 在 
XID 之 前 有 一 个 4 字 节 的 标志 /长 度 字段 ) ， 共 有 8 个 4 字 节 字段 ， 从 标志 / 
长 度 字 段 开始 ， 到 4 字 节 的 长 整数 过 程 结 果 为 止 ， 共 计 32 字 节 。 

当 使 用 UDP 时 ， 请 求 和 应 答 的 唯一 变动 是 不 存在 4 字 贡 的 标志 /长 度 
字段 。 因 此 请 求 的 大 小 为 44 字 市 ， 应 管 的 大 小 为 28 字 方 ， 这 一 点 可 使 
用 tcpdump 和 验证。 

16.9 可 以 。 不 论 在 客户 端 还 是 在 服务 器 端 ， 参 数 处 理 上 的 差异 都 
局 限于 主机 ， 而 与 穿越 网 络 的 分 组 无 关 。 客 户 的 main 画 数 调 用 客户 存 


根 中 的 某 个 画 数 以 产生 一 个 网 络 记录 ， 服 务 右 的 main 芳 数 则 调用 服务 
器 存根 中 的 某 个 函数 处 理 这 个 网 络 记 录 。 跨 越 网 络 传送 的 RPC 记 录 是 由 
RPC 协 议定 义 的 ， 而 RPC 协 议 不 论 客户 端 或 服务 需 端 是 否 文 持 线 程 都 不 


16.10 XDR 运 行 时 环境 给 这 些 字 符 串 动态 分 配 字 间 。 给 read 程 序 增 
加 下 面 一 行 就 能 验证 这 个 事实 : 

printf("sbrkQ= 96p,buff = %p,in.vstring_arg = %p\n", 

Sbrk(NULL),buff,in.vstring arg); 

其 中 sbrk 函 数 返 回 处 于 程序 数据 段 顶部 的 当前 地 址 ， 而 在 此 以 下 的 
内 存 空间 通常 就 是 malloc 从 中 分 配 内 存 的 区 段 。 运 行 该 程序 产生 如 下 输 
出 : 

sbrk()= 29638,buff = 25e48,in.vstring arg = 27e58 

E XE HH TR ET vstring_arg ts [n] mallocfs FH AJ Pe [X Ex ° 8192F B HJ 
bufft 地 址 为 0x25e48~0x27e47， 字 符 串 就 存放 在 该 缓冲 区 之 后 。 

16.11 图 D-13 给 出 了 客户 程序 。 注 意 clnt_call 的 最 后 一 个 参数 是 一 个 
真正 的 timeval 结 构 ， 而 不 是 指 癌 某 个 这 种 结构 的 指针 。 还 要 注意 
chnt_call 的 第 三 个 和 第 五 个 参数 必须 是 指 同 XDR 例 程 的 非 空 函数 指针 ， 
因此 我 们 指定 的 是 不 做 任何 工作 的 XDR 函 数 xdr_ void。 (编写 一 个 很 小 
的 RPC 规 范文 件 ， 其 中 定义 一 个 既 没 有 参数 也 没有 返回 值 的 函数 ， 运 行 
rpcgen， 然 后 检查 所 生成 的 客户 存根 ， 这 样 你 就 能 验证 图 D-13 中 给 出 的 
确实 是 调用 一 个 既 没有 参数 又 没有 返回 值 的 函数 的 方法 。) 


sunrpc/square I /client.c 


1 #include "unpipc.h" /* our header */ 

2 #include "square.h" /* generated by rpcgen */ 
3 int 

4 main(int argc, char **argv) 

5 

6 CLIENT *cl; 

7 struct timeval tv; 

8 if (arge != 3) 

9 err quit("usage: client «hostname» <protocol>") ; 
10 cl = Clnt create(argv[1], SQUARE PROG, SQUARE VERS, argv[2]1); 
11 tv.tv sec - 10; 

12 tv.tv usec - 0; 

13 if (clnt_call(cl, NULLPROC, xdr_void, NULL, 

14 xdr_void, NULL, tv) != RPC_SUCCESS) 

15 err quit("$s", clnt sperror(cl, argv[1])) 

16 exit (0); 

17 5 


sunrpc/square I /client.c 


图 D-13 调用 服务 器 空 过 程 的 客户 程序 


16.12 所 产生 的 UDP 数据 报 大 小 (65536+20+RPC 开 销 ) 超过 了 IPv4 
数据 报 的 最 大 大 小 65535。 图 A-4 中 对 于 使 用 UDP 的 RPC 来 说 ， 不 存在 消 
居 大 小 为 16384 和 32768 的 项 的 原因 是 ， 这 是 一 个 较 早 的 RPCSRC 4.0 实 
现 ， 它 把 UDP 数 据 报 的 大 小 限制 在 约 9000 字 市 左右 。 


[1]. 此 处 为 APUE 第 1 版 英文 原版 书页 码 ， 第 2 版 为 第 77~~78 页 ， 中 文 版 
为 第 61~-62 页 ° 编者 注 


[2]. 此 处 为 UNPv1 第 2 版 英文 原 版 书 世 号 ， 第 3 版 为 26.5 太 。 编者 注 


[3]. 此 处 为 UNPv1 第 2 版 英文 原 版 书页 码 ， 第 3 版 为 第 160~ 人 163 页 。 
编者 注 

第 3 版 为 第 134~-135 页 © 
编者 ; 


[5]. 注意 区 别 这 个 由 客户 主动 发 出 的 再 次 调用 和 因 超 时 重 传导 致 的 由 
RPC 运 行 时 环境 完成 的 再 次 调用 ， 后 着 对 客户 不 可 见 。 一 一 译 者 注 


参考 文献 


要 是 能 找到 本 参考 文献 所 引用 的 论文 或 报告 的 电子 文档 的 话 ， 我 
们 束 给 出 它们 的 URL。 需 留意 的 是 ， 这 些 URL 可 能 随时 间 而 变动 ， 
此 读者 应 经 常 访 问 作 者 在 http:W/www.kohala.com/~-rstevens 的 WWW 主 
页 ， 检 查 本 书 的 最 新 勘误 表 。 

Bach,M.J.1986.Th.Desig.o.th. UNI.Operatin.System.Prentic.Hall,Engle 
woo.Cliffs,N.J. 

Birrell,A.D.,an.Nelson,B.J.1984. 
"Implementin.Remot.Procedur.Calls,. AC.Transaction.o.Compute.Systems,v 
ol.2,no.1,pp.39-5.(Feb.). 

Butenhof,D.R.1997.Programmin.wit.POSI.Threads.Addison- 
Wesley,Reading,Mass. 

Corbin,J.R.1991.Th.Ar.o.Distribute. Applications 
Programmin. Technique.fo.Remot.Procedur.Calls.Springer-Verlag, Ne. York. 

Garfinkel,S.L.,an.Spafford,E.H.1996.Practica. UNI.an.Interne. Security, 
Secon.Edition.O’ Reill.. Associates, Sebastopol, Calif. 

Goodheart,B.,an.Cox,J.1994.Th.Magi.Garde.Explained.Th.Internal.o. 
UNL Syste..Releas.4,A.Ope.System.Design.Prentic.Hall,Englewoo.Cliffs,N. 
J. 


Hamilton,G.,an.Kougiouris,P.1993. 
“Th.Sprin.Nucleus : .Microkerne.fo.Objects,.Proceeding.o.th.199.Summe. 
USENI.Conference,pp.147-159,Cincinnati,Oh. 


http://www.kohala.com/ 2 
rstevens/papers.others/springnucleus.1993.ps 

IEEE.1996.“Informatio. Technology—Portabl.Operatin.Syste.Interfac. 

(POSIX.—Par.1:Syste.Applicatio.Progra.Interface(API. 
[.Language],.IEE.St.1003.1,199.Edition,Institut.o.Electrica.an.Electronic.En 
gineers,Piscataway,N.J.(July). 

这 个 版 本 的 Posix.1 含 有 1990 年 版 基本 API、1003.1b 实 时 扩展 
(19934) ^ 1003.1c Pthreads (1995 年 ) 以 及 1003-1i 技 术 性 更 正 
(1995 年 ) 。 它 同时 也 是 国际 标准 ISO/IEC 9945-1: 1996 (E)。IEEE 正 

式 标准 和 草案 标准 的 定购 信息 可 从 http: /www.ieee.org 获 取 。 遗憾 的 
是 ， 因 特 网 上 IEEE 标 准 不 是 免费 可 得 的 。 

Josey,A.,ed.1997.G.Sol.2.Th.Authorize.Guid.t.Versio..o.th.Singl.UNI. 
Specification. Prentic.Hall, Uppe.Saddl.River,N J. 

另 请 注意 ， 许 多 Unix 98 的 规范 (例如 所 有 的 手册 页 面 ) 可 从 

http;//www.UNIX-systems.org/online.html4E 223k HY » 

Kernighan,B.W.,an.Pike,R.1984. Th. UNI.Programmin.Environment.Pr 

entic.Hall,Englewoo.Cliffs,N.J. 

Kernighan,B. W.,an.Ritchie,D.M.1988.Th..Programmin.Language,Seco 

n.Edition.Prentice Hall,Englewood Cliffs,N.J. 

Kleiman,S.,Shah,D.,an.Smaalders,B.1996.Programmin.wit.Threads.Pr 

entic.Hall, Uppe.Saddl.River,N.J. 

Lewis,B.,an.Berg,D.J.1998.Multithreade.Programmin.wit.Pthreads.Pre 

ntic.Hall, Uppe.Saddl.River,N.J. 

McKusick,M.K.,Bostic,K.,Karels,M.J.,an.Quarterman,J.S.1996.Th.Des 

ig.an.Implementatio.o.th.4.4BS.Operatin.System. Addison- 
Wesley,Reading,Mass. 


McVoy,L.,an.Staelin,C.1996.“Imbench 
Portabl.Tool.fo.Performanc.Analysis,.Proceeding.o.th.199.Winte. Technica. 
Conference,pp.279-294,Sa.Diego, Calif. 

这 套 标 准 性 能 测试 工具 以 及 本 论文 可 从 
http://www.bitmover.com/Imbench7X EX ° 

Rochkind,M.J.1985.Advance.UNI.Programming.Prentic.Hall,Englewo 
o.Cliffs,N.J. 

Salus,P.H.1994..Quarte.Centur.o.Unix.Addison-Wesley,Reading,Mass. 

Srinivasan,R.1995a.“RPC 
Remot.Procedur.Cal.Protoco.Specificatio. Versio.2,.RF.1831,18 pages 
(Aug.). 

Srinivasan,R.1995b.“XDR 
Externa.Dat.Representatio.Standard,.RF.1832,2.page.(Aug.). 

Srinivasan,R.1995c. 

“Bindin.Protocol.fo.ON.RP. Versio.2,.RF.1833,1.page.(Aug.). 

Stevens,W.R.1992.Advance.Programmin.i.th.UNI. Environment. Addis 
on-Wesley,Reading,Mass. 

全 部 Unix 编 程 细 证 。 本 书 称 之 为 APUE 。 

Stevens,W.R.1994.TCP/I.Illustrated, Volum.1.Th.Protocols.Addison- 
Wesley,Reading,Mass. 

对 于 网 际 协议 的 完整 介绍 。 本 书 称 之 为 TCPv1 。 

Stevens,W.R.1996.TCP/1.Illustrated,Volum.3.TC.fo.Transactions, HTT 
P,NNTP,an.th. UNI.Domai.Protocols.Addison-Wesley,Reading,Mass. 

本 书 称 之 为 TCPV3 ° 

Stevens,W.R.1998.UNI.Networ.Programming, Volum.1,Secon.Edition, 
Networkin.A PIs:Socket.an. XTI.Prentic.Hall, Uppe.Saddl.River,N.J. 

本 书 称 之 为 UNPv1 ° 


Vahalia,U.1996.UNI.Internals.Th.Ne.Frontiers.Prentic.Hall, Uppe.Sadd 
|.River,N.J. 
White,J.E.1975.“.High-Leve.Framewor.fo.Network- 
Base.Resourc.Sharing,.RF.707,2.page.(Dec.). 
http://www.kohala.com/--rstevens/papers.others/rfc707.txt 
Wright,G.R.,an.Stevens,W.R.1995.TCP/I.Illustrated, Volum.2.Th.Imple 
mentation. Addison-Wesley,Reading,Mass. 


网 际 协 议 在 4.4BSD-Lite 操 作 系 统 上 的 实现 。 本 书 称 之 为 TCPv2 ° 


索引 


我 们 不 提供 一 个 单独 的 词汇 表 〈 其 中 大 多 数 条 目 将 是 首 字母 缩写 
ij) ， 不 过 本 索引 也 可 用 作 本 书 所 用 所 有 首 字 和 母 缩 写 词 的 词汇 表 。 可 
以 首 字 母 缩 写 的 词 条 其 主 条 目 编排 在 缩写 词 之 下 。 举 例 来 说 ， 所 有 对 
Remote Procedure Call (远程 过 程 调用 ) 的 引用 出 现在 RPC 之 下 ; 在 完 
整 词 条 “Remote Procedure Call* 之 下 的 条 目 只 是 引用 回 RPC 之 下 的 主 条 
H o 

每 个 C 函 数 的 “definition of (定义 ) ”条 目 给 出 该 函数 带 方 框 的 函数 
原型 即 基 本 描述 的 所 在 页 。 每 个 结构 的 “definition of (定义 ) "条目 给 
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System V message queue (System V 消 息 队 列 限制 ) , 152-154 
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<limits.h> header (<limits.h> 头 文件 ) , 72 
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McKusick,M.K.,311,536 

McVoy,L.,458,536 

memcpy function (memcpy žk) , 127,526 

memory (内 存 ) 

leak (内 存 空间 泄漏 ) ，114,175,452,521 
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M-to-N thread implementation (M 对 N 线 程 实现 ) , 163 
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NCS (Network Computing System),406 
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network programming,explicit 〈《 显 式 网 络 编程 ) , 4,399,403 
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Network Computing Kernel (网 络 计算 内 核 ， 见 NCK 

Network Computing System (网 络 计 算 系 统 ) ， 见 NCS 

Network Data Representation (网 络 数 据 表 示 ) ， 见 NDR 

Network File System (网 络 文件 系统 ) ， 见 NFS 

Network Interface Definition Language (网 络 接 口 定 义 语言 ) ， 见 
NIDL 

Network News Transfer Protocol (网 络 新 闻 传 送 协 议 ) ， 见 NNTP 

networked IPC ( 连 网 的 IPC) ，453 

NFS (Network File System),404,406,411,417,495 

and FIFO (NFS4jFIFO) , 66 

locking (NFS 上 锁 ) , 216 

secure (安全 NFS) ，417 


NIDL (Network Interface Definition Language),406 

NNTP (Network News Transfer Protocol),67 
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O CREAT constant ( O CREAT 常 值 ) ， 22-25,31,54,77,110- 
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26,61,63,77,115,225,327 O_RDWR constan (t O RDWR?É fH) , 22,25- 
26,77,115,225,327 

O TRUNC constant (O TRUNC?É[H) , 22,24,216-217,327,523 
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oa base member 《oa_base 成 员 ) , 416 
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ONC (Open Network Computing),406 
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Operation Support Systems (操作 支持 系统 ) , 28 

optarg variable (optarg 变 量 ) , 82 

optind variable (optind 变 量 ) , 78 
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OSI (open systems interconnection),426 
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PATH environment variable (PATH 环境 变量 ) ，52 

PATH, MAX constant (PATH_MAX 常 值 ) ，19,22 
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pause function (pauseEX 2X) , 90-91,230,359,420 

pclose function (pcloseEgZW) , 52-53,73 

definition of (pclose 函 数 定 义 ) , 52 
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PDP-11,37 
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message passing latency (消息 传递 延迟 性 能 ) ，480-486 
process synchronization (进程 同步 性 能 ) ，497-499 

thread synchronization (线程 同步 性 能 ) ，486-496 
permissions (权限 ) 

FIFO (FIFO 权 限 ) 

file (文件 权限 ) , 203,205,216,397 

Posix IPC (Posix IPC 权 限 ) , 23,25-26,84,115,225,232,267,327 
System V IPC (System V IPC 权限 ) , 31-35,39,130-131,282- 
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filesystem ( 随 文件 系统 的 持续 性 ) ，6-7,78,311 

IPC ( 随 IPC 的 持续 性 ) , 6-7 

kernel 〈 随 内 核 的 持续 性 ) ，6,75,77,226 

process 〈《 随 进程 的 持续 性 ) ，6 
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limits (管道 限制 ) 72-73 
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pipe function (pipet) ，44,50,56,58,68,73,91 
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PIPE BUF constant (PIPE_BUF 常 值 ) ，59-60,65,72-73,260 
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列 ) ，151-152 

polling ( 轮 询 ) 87,167,214 

popen function (popen 范 数 ) , 52-53,73-74,518 

definition of (popen 函 数 定义 ) , 52 
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ephemeral (临时 端口 ) ，404,411,414,450 

mapper (端口 影射 器 ) , 404,406,411-414,450-451,532 
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Posix (Portable Operating System Interface),13-14 

IPC (Posix IPC) , 19-26 
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round-trip (往返 时 间 ) ，451,458 

time function (time 范 数 ) ，91 

timeout (超时 ) ，67,171,424,426 

and retransmission,RPC (RPC 超 时 与 重 传 ) ，417-422 
TIMEOUT constant (TIMEOUT?É[H) , 420 

timer getoverrun function (timer getoverrunEg4 Z4) , 91 
timer gettime function (timer gettime 范 数 ) , 91 
timer settime function (timer _settime KŻ) , 91,101 
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Transport Interface (X/Open 传输 接口 ) ， 见 XTI 
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索 函 数 原型 索引 表 
(下 面 所 列 页 码 均 指 页 边栏 中 标注 的 页 码 ) 


函数 原型 页 码 


bool t clnt_control (CLIENT *cl, unsigned int request, char *ptr); 418 
CLIENT *clnt create(const char *host, unsigned long prognum, 
unsigned long versnum, const char *protocol); 401 


void clnt destroy(CLIENT *c); 420 


int door bind(int fd); 390 
int door call(int fd, door arg t *argp); 361 
int door create(Door server proc *proc, void *cookie, u int attr); 363 
int door cred(door cred t *cred) ; 365 
int door info(int fd, door info t *info); 365 
int door return(char *dataptr, size t datasize, door desc t *descptr, size t ndesc); 365 
int door revoke(int fd) ; 390 
Door create proc  *door server create(Door create proc *proc); 384 
int door unbind(void); 390 
void err dump(const char *fmt, ...); 512 
void err msg(const char *fmt, ...); 512 
void err quit(const char ‘fmt, ...); 512 
void err ret(const char *fmt, ...); 511 
void err sys(const char ‘fmt, ...); ` 511 
int fentl(int fd, int cmd, ... /* struct flock *arg */ ); 199 
int f£stat(int fd, struct stat *buf); 328 
key t ftok(const char “pathname, int id); 28 
int ftruncate(int fd, off t length) ; 327 
int mkfifo(const char *pathname, mode t mode) ; 54 
void *mmap(void *addr, size t len, int prot, int flags, int fd, off c offset); 308 
int msync(void *addr, size t len, int flags); 310 
int munmap(void *addr, size t len); 309 
int mq close(mqd t m@des) ; 77 
int mq getattr(mqgd t mqgdes, struct mq attr *attr); 79 
int mq notify(mqd t mqdes, const struct sigevent *notification) ; 87 
mqd t mq open(const char *name, int oflag, i 

/* mode t mode, struct mq attr *attr */ ); 76 
ssize t mq receive(mqgd t mqdes, char *ptr, size t len, unsigned int *priop); 83 
int mq send(mqd t mgdes, const char *ptr, size t len, unsigned int prio); 83 
int mq setattr(mqd t mqdes, const struct mq attr *attr, struct mq attr *oattr); 79 
int mq unlink(const char *name); 77 
int msgctl(int msgid, int cmd, struct msqid ds *buff) ; 134 
int msgget(key t key, int oflag); 130 
ssize t msgrcv(int msqid, void *ptr, size t length, long type, int flag); 132 
int msgsnd(int msgid, const void *ptr, size t length, int flag); 131 
int pclose(FILE *stream); 52 
int pipe(int fd[2]); +H 


N 


FILE *popen(const char *command, const char *type); 5 


函数 原型 页 码 
int pthread cancel(pthread t tid); 187 
void pthread cleanup pop(int execute) ; 187 
void pthread cleanup push(void (*function) (void *), void *arg); 187 
int pthread create(pthread t *lid, const pthread attr t ‘attr, 
void *(*func) (void *), void *arg); 502 
int pthread detach(pthread t lid); 504 
void pthread exit(void *status) ; 504 
int pthread join(pthread t fid, void **status) ; 503 
pthread t pthread self (void); 503 
int pthread condattr destroy(pthread condattr t *attr); 172 
int pthread condattr getpshared(const pthread condattr t *attr, int *valptr) ; 173 
int pthread condattr init(pthread condattr t *attr); 172 
int pthread condattr setpshared(pthread condattr t ‘attr, int value); 173 
int pthread cond broadcast(pthread cond t *cptr); 171 
int pthread cond destroy(pthread cond t ‘*qptr); 172 
int pthread cond init(pthread cond t *cptr, const pthread condattr t *attr) ; 172 
int pthread cond signal(pthread cond t *cptr); 167 
int pthread cond timedwait(pthread cond t *cpjr, pthread mutex t *mptr, 
const struct timespec *abstime) ; 171 
int pthread cond wait(pthread cond t *cptr, pthread mutex t *mptr); 167 
int pthread mutexattr destroy(pthread mutexattr t *attr) ; 172 
int pthread mutexattr getpshared(const pthread mutexattr t ‘attr, int *valptr) ; 173 
int pthread mutexattr init(pthread mutexattr t *attr); 172 
int pthread mutexattr setpshared(pthread mutexattr t *attr, int value); 173 
int pthread mutex destroy(pthread mutex t *mptr); 172 
int pthread mutex init(pthread mutex t *mptr, const pthread mutexattr t *attr); 172 
int pthread mutex lock(pthread mutex t *"mptr); 160 
int pthread mutex trylock(pthread mutex t *mptr) ; 160 
int pthread mutex unlock(pthread mutex t *mptr); 160 
int pthread rwlockattr destroy(pthread rwlockattr t *attr) ; 179 
int pthread rwlockattr getpshared(const pthread rwlockattr t ‘attr, int *valptr); 179 
int pthread rwlockattr init(pthread rwlockattr t ‘*attr) ; 179 
int pthread rwlockattr setpshared(pthread rwlockattr t ‘attr, int value); 179 
int pthread rwlock destroy(pthread rwlock t *ruptr); 179 
int pthread rwlock init(pthread rwlock t *ruptr, 
const pthread rwlockattr t *attr); 179 
int pthread rwlock rdlock(pthread rwlock t *ruptr); 178 
int pthread rwlock tryrdlock(pthread rwlock t *ruptr); 178 
int pthread rwlock trywrlock(pthread rwlock t *ruptr); 178 
int pthread rwlock unlock(pthread rwlock t *rwptr) ; 178 


int pthread rwlock wrlock(pthread rwlock t *ruptr); 178 


函数 原型 页 码 
long pr thread id(pthread t *ptr); 371 
char *px ipc name(const char *name) ; 21 
int sem destroy(sem t *sem); 239 
int sem getvalue(sem t *sem, int *valp); 227 
int sem init(sem t *sem, int shared, unsigned int value) ; 239 
sem t  *sem open(const char *name, int oflag, ‘ 

/* mode t mode, unsigned int value */ ); 225 
int sem post(sem t *sem); 227 
int sem trywait(sem t *sem); 226 
int sem unlink(const char *name) ; 226 
int sem wait(sem t *sem); 226 
int  semctl(int semid, int semnum, int cmd, ... /* union semun arg */ ); 287 
int  semget(key t key, int msems, int oflag); 282 
int  semop(int semid, struct sembuf *opsptr, size t nops); 285 
int shm_open(const char *name, int oflag, mode t mode); 326 
int shm_unlink(const char *name); 326 
void *shmat (int shmid, const void *shmaddr, int flag); 344 
int shmetl(int shmid, int cmd, struct shmid ds *buff) ; 345 
int shmdt(const void *shmaddr) ; 345 
int shmget(key t key, size t size, int oflag); 344 
int  sigwait(const sigset t *set, int *sig); 95 
int start time(void); 470 
double stop time(void); 470 
int svc dg enablecache(SVCXPRT *xpri, unsigned long size); 422 
int touch(void *uptr, int nbytes); 470 
void tv sub(struct timeval *out, struct timeval *im); 471 


结构 定义 索引 表 
(下 面 所 列 页 码 均 指 页 边栏 中 标注 的 页 码 ) 


accepted reply 
authsys, parms 


call body 


d desc 


door arg t 
door cred t 
door desc. t 
door info t 


flock 


ipc perm 


mismatch info 


mq attr 
msgbuf 
msg_perm 
msqid_ds 


447 
416 


opaque_auth 


rejected_reply 
reply_body 


rpc_msg 


sem 
sembuf 
semid_ds 
sem_perm 
semun 
shmid_ds 
shm_perm 
sigaction 
sigevent 
siginfo_t 
sigval 
stat 

svc req 


timespec 


